Select Language

Open Dataset

CoNLL003 命名エンティティ認識(NER)問題のアノテーションデータセット これは固有表現抽出(NER)問題の注釈付きデータセットです。内容このデータセットはtrain.txt、te...NLP,Arts and Entertainment,Computer Science,Text Data,Games,Text Mining Classification
4.63M 569
命名实体認識(NER)は臨床から関心のあるエンティティ(例えば、疾患名、薬剤名)を抽出する 問題の説明臨床研究では、臨床記述に文書化された患者の詳細な情報が必要とされることが多い。名前付き...NLP,Health,Health Conditions,Model Comparison,Statistical Analysis,Artificial Intelligence Classification
249.01M 433
マシャド・デ・アッシスの116部の小説とその他のテキストデータ このリポジトリには、マシャド・デ・アシスの116のフィクション作品やその他のテキストがpdfとtxt形式で収められています...NLP,Business,Literature,Art,Brazil Classification
40.38M 768
Dmoztools分類データ、芸術、ビジネス、コンピュータ、ゲーム、健康、科学、ショッピング、社会などを含む # データセットこのデータセットはPatanjali Chintalapatiによって作成されました。その他(説明で指定)の条件で公開されています。# 内容それはc...NLP,Text Mining,Websites Classification
279.6M 488
ATISデータセットのクリーニング再開、ATISデータセットのクリーニングとバランス分割 ATISデータセットATISデータセットは、意図分類とスロット埋めタスクとして広く使用される標準的なベンチマークデータセットです...NLP,Classification,Earth and Nature,Computer Science,Health Classification
1.02M 515
文献計量学 # データセット このデータセットはDaniel S. Hainによって作成されました # 内容には以下のファイルが含まれます:...NLP Classification
9.78M 430
Goodreadsからの2018年の最高の書籍データ Goodreadsからの2018年の最高の書籍データ...NLP,Image Data,Tabular Data,Literature Classification
81.57M 814
バート大全字マスキング Internet,Software,NLP Classification
2559.42M 482
Jester Jokesデータセット 100万行以上と各行の評価を含むデータセット このデータセットには100万を超えるジョークと、各ジョークに対するユーザーの評価が含まれています...NLP,Text Data Classification
44.46M 516
命名エンティティ認識に使用する注釈付きコーパス、BIOおよびPOSタグで注釈付けされたコーパス 固有表現抽出のための注釈付き(BIO)コーパス このコーパスはニュースサイトのテキストから構成され、特に作成されたものです...Business,Arts and Entertainment,Literature,Languages Classification
2.21M 594
FACENS NLPコーパス分類 FACENS DSコースの最初のNLP活動の基礎データセット ファセンス大学のデータサイエンスコースの自然言語処理(NLP)のアクティビティ01のデータセットとして渡されました。Kaggleで全体が保持されています、同じ...NLP,Health,Multiclass Classification Classification
0.89M 616
ICDAR 2013データセット 1 ギリシャ語と英語で記載された150枚の画像、およびインドのバングラ語で記載された50枚の画像。2 白黒の……...NLP Text
172.61M 1489
MJSynth 合成単語データセット 合成語データセット これは合成的に生成されたデータセットであり、実世界の画像におけるテキスト認識のトレーニングに十分であると我々が判断したものです。...NLP Classification
9.95G 1604