Related data classification
9
534
2
5
9
11
15
2
2
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
DBpediaセマンティックウェブの応用例で、42782編のウィキペディア記事に分類と階層化されたカテゴリが提供されています。
DBpedia(データベースを意味する「DB」から由来)は、ウィキペディアで作成された情報から構造化されたコンテンツを抽出することを目的としたプロジェクトです。...Education,Text Data,Multiclass Classification,Text Mining Classification
443.28M
431
Dan Ofer
Mac Morpho、品詞タグ付きのブラジルポルトガル語のニューステキスト
NLTKに関する正規メタデータ:packageid=mac_morphoname=MAC-MORPHO:ブラジルポルトガル語のニューステキストと品詞タグ付きwebp...Earth and Nature Classification
10.43M
835
NLTK Data
2.46M
458
NLTK Data
スタンフォード自然言語推論 (SNLI) コーパスのJsonl形式
これはスタンフォード大学の自然言語推論(snLI)コーパスの1.0版です。このコーパスを使用する場合は、この論文を引用してください:http://nlp.Stanford.edu/pubs/snli...Languages Classification
483.45M
524
John S. Hudzina
英語の単語頻度、⅓百万のインターネット上で最も一般的な英語の単語
このデータセットには、英語のウェブ上で最も一般的に使用される333,333個の単語の出現回数が含まれており、これは...Languages Classification
4.73M
707
Rachael Tatman
有毒な埋め込み物、パズルの有毒コメントチャレンジにおける汎用的な文章符号化テキスト
誰もが同じテキストをUniversal Sentence Embeddingでエンコードする必要はありません。このデータセットには...NLP,Deep Learning,Earth and Nature Classification
610.81M
719
Liling Tan
CoNLL003 命名エンティティ認識(NER)問題のアノテーションデータセット
これは固有表現抽出(NER)問題の注釈付きデータセットです。内容このデータセットはtrain.txt、te...NLP,Arts and Entertainment,Computer Science,Text Data,Games,Text Mining Classification
4.63M
572
AlaaKhaled
サンセリフのグーグルフォントで書かれた文字画像データセット
# データセットこのデータセットはYeom Jihyeによって作成されました。他のライセンス(説明で指定)の下で公開されています。# 内容これには...NLP,Image Data Classification
768M
543
CheaperThanTires
命名实体認識(NER)は臨床から関心のあるエンティティ(例えば、疾患名、薬剤名)を抽出する
問題の説明臨床研究では、臨床記述に文書化された患者の詳細な情報が必要とされることが多い。名前付き...NLP,Health,Health Conditions,Model Comparison,Statistical Analysis,Artificial Intelligence Classification
249.01M
433
Ramashankar Nayak
マシャド・デ・アッシスの116部の小説とその他のテキストデータ
このリポジトリには、マシャド・デ・アシスの116のフィクション作品やその他のテキストがpdfとtxt形式で収められています...NLP,Business,Literature,Art,Brazil Classification
40.38M
768
Luiz Amaral
Dmoztools分類データ、芸術、ビジネス、コンピュータ、ゲーム、健康、科学、ショッピング、社会などを含む
# データセットこのデータセットはPatanjali Chintalapatiによって作成されました。その他(説明で指定)の条件で公開されています。# 内容それはc...NLP,Text Mining,Websites Classification
279.6M
490
Patanjali Chintalapati
ATISデータセットのクリーニング再開、ATISデータセットのクリーニングとバランス分割
ATISデータセットATISデータセットは、意図分類とスロット埋めタスクとして広く使用される標準的なベンチマークデータセットです...NLP,Classification,Earth and Nature,Computer Science,Health Classification
1.02M
517
kpe
バングラデシュの手書き数字(dot npz形式)
ベンガル語手書き数字(.npz形式)このファイルにはNumtaDB:ベンガル語手書き数字(.npz形式)が含まれています。...Image Data Classification
268.7M
634
Yakin
9.78M
435
Daniel S. Hain
Goodreadsからの2018年の最高の書籍データ
Goodreadsからの2018年の最高の書籍データ...NLP,Image Data,Tabular Data,Literature Classification
81.57M
817
Naren
Jester Jokesデータセット 100万行以上と各行の評価を含むデータセット
このデータセットには100万を超えるジョークと、各ジョークに対するユーザーの評価が含まれています...NLP,Text Data Classification
44.46M
517
Sameer Dev
命名エンティティ認識に使用する注釈付きコーパス、BIOおよびPOSタグで注釈付けされたコーパス
固有表現抽出のための注釈付き(BIO)コーパス このコーパスはニュースサイトのテキストから構成され、特に作成されたものです...Business,Arts and Entertainment,Literature,Languages Classification
2.21M
595
Alexander Kovalev