Related data classification
9
534
2
5
9
11
15
2
2
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
百科類質問と回答のJSON版、事前にフィルタリングされた150万個の高品質の質問と回答が含まれています
このデータセットには、事前にフィルタリングされた150万個の高品質な百科事典系の質問と回答が含まれています。データセットには合計492のカテゴリがあり、そのうち頻度が10回以上に達するカテゴリは434あります。...NLP Text
1.5G
1251
Thomas-yanxin
9.88M
771
Bianchini, Francesco,Gazzard, Katherine
僧伽羅語数字語彙(1.0版)、アルファベットAからMのデータセット
サンスクリット語数字語彙表(1.0版)、アルファベットAからM、www.siddham.netへのリンク...NLP Classification
9.83M
738
Bianchini, Francesco,Gazzard, Katherine
人民日報品詞付きコーパスデータ(1998年01月)
人民日報のコーパス、形態素解析と品詞タグ付け(POS)のコーパス(単語分割と品詞のための中国語コーパス)リソースは1998年1 - 6月の人民日報に関するものです。...NLP Text
2.81M
1131
人民日报
Twitter感情分析訓練コーパス
ツイッターの感情分析データセットには1,578,627件の分類済みツイートが含まれており、各行は、積極的な感情を表す場合は1、消極的な感情を表す場合は0としてラベル付けされています。私はコーパスの1/10を使ってあなたをテストすることをおすすめします。...MNIST Classification
53.8M
873
robot
20万英語ユーモアテキストデータセット
公開時間:2016年 このデータベースには約208,000個のジョークがあります。現在のデータセットのファイルには、3つのソースからのジョークが含まれています。---------------------------------...OCR/Text Detection Classification
24.57M
847
robot
人民日報品詞付きコーパスデータ(199801)
人民日報のコーパス、形態素解析と品詞タグ付け(POS)のコーパス(単語分割と品詞のための中国語コーパス)リソースは1998年の人民日報の1 - 6月分...OCR/Text Detection Classification
3.37M
988
robot
中国文字20950、UTF - 8におけるすべての漢字とその発音のデータセット
中国文字20950、UTF - 8におけるすべての漢字とその発音のデータセット...NLP,Comics and Animation Classification
1.2M
397
-T.K.-
中国機械翻訳研究会、コーパスデータセット
# データセットこのデータセットはTan Lilingによって作成されました。その他(説明で指定)の下で公開されました。# 内容これには...Deep Learning,Computer Science Classification
6.6G
492
Warmth
DBpediaセマンティックウェブの応用例で、42782編のウィキペディア記事に分類と階層化されたカテゴリが提供されています。
DBpedia(データベースを意味する「DB」から由来)は、ウィキペディアで作成された情報から構造化されたコンテンツを抽出することを目的としたプロジェクトです。...Education,Text Data,Multiclass Classification,Text Mining Classification
443.28M
428
Dan Ofer
Mac Morpho、品詞タグ付きのブラジルポルトガル語のニューステキスト
NLTKに関する正規メタデータ:packageid=mac_morphoname=MAC-MORPHO:ブラジルポルトガル語のニューステキストと品詞タグ付きwebp...Earth and Nature Classification
10.43M
833
NLTK Data
スタンフォード自然言語推論 (SNLI) コーパスのJsonl形式
これはスタンフォード大学の自然言語推論(snLI)コーパスの1.0版です。このコーパスを使用する場合は、この論文を引用してください:http://nlp.Stanford.edu/pubs/snli...Languages Classification
483.45M
524
John S. Hudzina