Select Language

Open Dataset

ニュース分類データセットサンプル(thu) ニュース分類データセットサンプル(thu)...NLP Text
12M 1036
百科類質問と回答のJSON版、事前にフィルタリングされた150万個の高品質の質問と回答が含まれています このデータセットには、事前にフィルタリングされた150万個の高品質な百科事典系の質問と回答が含まれています。データセットには合計492のカテゴリがあり、そのうち頻度が10回以上に達するカテゴリは434あります。...NLP Text
1.5G 1251
僧伽羅語の数字語彙(2.0版)、アルファベットAからM シンハラ語・プラークリト語デジタル用語集(バージョン2.0)、AからMまでの文字...NLP Classification
9.88M 771
僧伽羅語数字語彙(1.0版)、アルファベットAからMのデータセット サンスクリット語数字語彙表(1.0版)、アルファベットAからM、www.siddham.netへのリンク...NLP Classification
9.83M 738
人民日報品詞付きコーパスデータ(1998年01月) 人民日報のコーパス、形態素解析と品詞タグ付け(POS)のコーパス(単語分割と品詞のための中国語コーパス)リソースは1998年1 - 6月の人民日報に関するものです。...NLP Text
2.81M 1131
Twitter感情分析訓練コーパス ツイッターの感情分析データセットには1,578,627件の分類済みツイートが含まれており、各行は、積極的な感情を表す場合は1、消極的な感情を表す場合は0としてラベル付けされています。私はコーパスの1/10を使ってあなたをテストすることをおすすめします。...MNIST Classification
53.8M 873
20万英語ユーモアテキストデータセット 公開時間:2016年 このデータベースには約208,000個のジョークがあります。現在のデータセットのファイルには、3つのソースからのジョークが含まれています。---------------------------------...OCR/Text Detection Classification
24.57M 847
人民日報品詞付きコーパスデータ(199801) 人民日報のコーパス、形態素解析と品詞タグ付け(POS)のコーパス(単語分割と品詞のための中国語コーパス)リソースは1998年の人民日報の1 - 6月分...OCR/Text Detection Classification
3.37M 988
中国文字20950、UTF - 8におけるすべての漢字とその発音のデータセット 中国文字20950、UTF - 8におけるすべての漢字とその発音のデータセット...NLP,Comics and Animation Classification
1.2M 397
情緒関連テキストデータセット 情緒関連テキストデータセット...Movies and TV Shows Classification
11.3M 423
中国機械翻訳研究会、コーパスデータセット # データセットこのデータセットはTan Lilingによって作成されました。その他(説明で指定)の下で公開されました。# 内容これには...Deep Learning,Computer Science Classification
6.6G 492
DBpediaセマンティックウェブの応用例で、42782編のウィキペディア記事に分類と階層化されたカテゴリが提供されています。 DBpedia(データベースを意味する「DB」から由来)は、ウィキペディアで作成された情報から構造化されたコンテンツを抽出することを目的としたプロジェクトです。...Education,Text Data,Multiclass Classification,Text Mining Classification
443.28M 428
Mac Morpho、品詞タグ付きのブラジルポルトガル語のニューステキスト NLTKに関する正規メタデータ:packageid=mac_morphoname=MAC-MORPHO:ブラジルポルトガル語のニューステキストと品詞タグ付きwebp...Earth and Nature Classification
10.43M 833
スタンフォード自然言語推論 (SNLI) コーパスのJsonl形式 これはスタンフォード大学の自然言語推論(snLI)コーパスの1.0版です。このコーパスを使用する場合は、この論文を引用してください:http://nlp.Stanford.edu/pubs/snli...Languages Classification
483.45M 524
Googleニュースベクトルネガティブ Googleニュースベクトルネガティブ...Clothing and Accessories Classification
3.64G 475