Related Search
您是不是在找?
Today ranking
Weekly Best Sellers
Monthly Best Sellers
Goodreadsからの2018年の最高の書籍データ
Goodreadsからの2018年の最高の書籍データ...NLP,Image Data,Tabular Data,Literature Classification
81.57M
816
Naren
9.78M
430
Daniel S. Hain
バングラデシュの手書き数字(dot npz形式)
ベンガル語手書き数字(.npz形式)このファイルにはNumtaDB:ベンガル語手書き数字(.npz形式)が含まれています。...Image Data Classification
268.7M
632
Yakin
ATISデータセットのクリーニング再開、ATISデータセットのクリーニングとバランス分割
ATISデータセットATISデータセットは、意図分類とスロット埋めタスクとして広く使用される標準的なベンチマークデータセットです...NLP,Classification,Earth and Nature,Computer Science,Health Classification
1.02M
516
kpe
Dmoztools分類データ、芸術、ビジネス、コンピュータ、ゲーム、健康、科学、ショッピング、社会などを含む
# データセットこのデータセットはPatanjali Chintalapatiによって作成されました。その他(説明で指定)の条件で公開されています。# 内容それはc...NLP,Text Mining,Websites Classification
279.6M
488
Patanjali Chintalapati
マシャド・デ・アッシスの116部の小説とその他のテキストデータ
このリポジトリには、マシャド・デ・アシスの116のフィクション作品やその他のテキストがpdfとtxt形式で収められています...NLP,Business,Literature,Art,Brazil Classification
40.38M
768
Luiz Amaral
命名实体認識(NER)は臨床から関心のあるエンティティ(例えば、疾患名、薬剤名)を抽出する
問題の説明臨床研究では、臨床記述に文書化された患者の詳細な情報が必要とされることが多い。名前付き...NLP,Health,Health Conditions,Model Comparison,Statistical Analysis,Artificial Intelligence Classification
249.01M
433
Ramashankar Nayak
サンセリフのグーグルフォントで書かれた文字画像データセット
# データセットこのデータセットはYeom Jihyeによって作成されました。他のライセンス(説明で指定)の下で公開されています。# 内容これには...NLP,Image Data Classification
768M
543
CheaperThanTires
CoNLL003 命名エンティティ認識(NER)問題のアノテーションデータセット
これは固有表現抽出(NER)問題の注釈付きデータセットです。内容このデータセットはtrain.txt、te...NLP,Arts and Entertainment,Computer Science,Text Data,Games,Text Mining Classification
4.63M
569
AlaaKhaled
有毒な埋め込み物、パズルの有毒コメントチャレンジにおける汎用的な文章符号化テキスト
誰もが同じテキストをUniversal Sentence Embeddingでエンコードする必要はありません。このデータセットには...NLP,Deep Learning,Earth and Nature Classification
610.81M
718
Liling Tan
英語の単語頻度、⅓百万のインターネット上で最も一般的な英語の単語
このデータセットには、英語のウェブ上で最も一般的に使用される333,333個の単語の出現回数が含まれており、これは...Languages Classification
4.73M
707
Rachael Tatman
スタンフォード自然言語推論 (SNLI) コーパスのJsonl形式
これはスタンフォード大学の自然言語推論(snLI)コーパスの1.0版です。このコーパスを使用する場合は、この論文を引用してください:http://nlp.Stanford.edu/pubs/snli...Languages Classification
483.45M
524
John S. Hudzina
2.46M
458
NLTK Data
Mac Morpho、品詞タグ付きのブラジルポルトガル語のニューステキスト
NLTKに関する正規メタデータ:packageid=mac_morphoname=MAC-MORPHO:ブラジルポルトガル語のニューステキストと品詞タグ付きwebp...Earth and Nature Classification
10.43M
833
NLTK Data
DBpediaセマンティックウェブの応用例で、42782編のウィキペディア記事に分類と階層化されたカテゴリが提供されています。
DBpedia(データベースを意味する「DB」から由来)は、ウィキペディアで作成された情報から構造化されたコンテンツを抽出することを目的としたプロジェクトです。...Education,Text Data,Multiclass Classification,Text Mining Classification
443.28M
430
Dan Ofer
中国機械翻訳研究会、コーパスデータセット
# データセットこのデータセットはTan Lilingによって作成されました。その他(説明で指定)の下で公開されました。# 内容これには...Deep Learning,Computer Science Classification
6.6G
492
Warmth
スタートレックの脚本、すべての《スタートレック》シリーズの脚本のオリジナルテキスト脚本と処理行
スター・トレックの脚本テキストデータは、http://www.chakoteya.net/StarTrek/index.html のデータからスクレイピングされました。コードはこちら:https://github。...NLP,Movies and TV Shows,Text Data,Text Mining Classification
42.63M
362
Gary Broughton
ロボット様に登場する単語イベント、F-Societyが好きな流行語を知る
「Mr. Robot」は、データを破壊すること、暗号化すること、削除することなど、すべてデータに関するものです。私はいくつかのデータを掘り起こしたいと思いました。...Arts and Entertainment,Games Classification
0.31M
423
Emma