Select Language

Open Dataset

Related Search
您是不是在找?
Today ranking
Weekly Best Sellers
Monthly Best Sellers
Goodreadsからの2018年の最高の書籍データ Goodreadsからの2018年の最高の書籍データ...NLP,Image Data,Tabular Data,Literature Classification
81.57M 816
文献計量学 # データセット このデータセットはDaniel S. Hainによって作成されました # 内容には以下のファイルが含まれます:...NLP Classification
9.78M 430
バングラデシュの手書き数字(dot npz形式) ベンガル語手書き数字(.npz形式)このファイルにはNumtaDB:ベンガル語手書き数字(.npz形式)が含まれています。...Image Data Classification
268.7M 632
ATISデータセットのクリーニング再開、ATISデータセットのクリーニングとバランス分割 ATISデータセットATISデータセットは、意図分類とスロット埋めタスクとして広く使用される標準的なベンチマークデータセットです...NLP,Classification,Earth and Nature,Computer Science,Health Classification
1.02M 516
Dmoztools分類データ、芸術、ビジネス、コンピュータ、ゲーム、健康、科学、ショッピング、社会などを含む # データセットこのデータセットはPatanjali Chintalapatiによって作成されました。その他(説明で指定)の条件で公開されています。# 内容それはc...NLP,Text Mining,Websites Classification
279.6M 488
マシャド・デ・アッシスの116部の小説とその他のテキストデータ このリポジトリには、マシャド・デ・アシスの116のフィクション作品やその他のテキストがpdfとtxt形式で収められています...NLP,Business,Literature,Art,Brazil Classification
40.38M 768
0.12M 611
命名实体認識(NER)は臨床から関心のあるエンティティ(例えば、疾患名、薬剤名)を抽出する 問題の説明臨床研究では、臨床記述に文書化された患者の詳細な情報が必要とされることが多い。名前付き...NLP,Health,Health Conditions,Model Comparison,Statistical Analysis,Artificial Intelligence Classification
249.01M 433
サンセリフのグーグルフォントで書かれた文字画像データセット # データセットこのデータセットはYeom Jihyeによって作成されました。他のライセンス(説明で指定)の下で公開されています。# 内容これには...NLP,Image Data Classification
768M 543
CoNLL003 命名エンティティ認識(NER)問題のアノテーションデータセット これは固有表現抽出(NER)問題の注釈付きデータセットです。内容このデータセットはtrain.txt、te...NLP,Arts and Entertainment,Computer Science,Text Data,Games,Text Mining Classification
4.63M 569
有毒な埋め込み物、パズルの有毒コメントチャレンジにおける汎用的な文章符号化テキスト 誰もが同じテキストをUniversal Sentence Embeddingでエンコードする必要はありません。このデータセットには...NLP,Deep Learning,Earth and Nature Classification
610.81M 718
英語の単語頻度、⅓百万のインターネット上で最も一般的な英語の単語 このデータセットには、英語のウェブ上で最も一般的に使用される333,333個の単語の出現回数が含まれており、これは...Languages Classification
4.73M 707
スタンフォード自然言語推論 (SNLI) コーパスのJsonl形式 これはスタンフォード大学の自然言語推論(snLI)コーパスの1.0版です。このコーパスを使用する場合は、この論文を引用してください:http://nlp.Stanford.edu/pubs/snli...Languages Classification
483.45M 524
NPSチャット,NPSチャットコーパス コンテキストNLTK上の規範的なメタデータ:...Computer Science,Online Communities Classification
2.46M 458
Mac Morpho、品詞タグ付きのブラジルポルトガル語のニューステキスト NLTKに関する正規メタデータ:packageid=mac_morphoname=MAC-MORPHO:ブラジルポルトガル語のニューステキストと品詞タグ付きwebp...Earth and Nature Classification
10.43M 833
ベトナム語住所手書きデータセット ベトナム語住所手書きデータセット...MNIST Classification
423.81M 443
DBpediaセマンティックウェブの応用例で、42782編のウィキペディア記事に分類と階層化されたカテゴリが提供されています。 DBpedia(データベースを意味する「DB」から由来)は、ウィキペディアで作成された情報から構造化されたコンテンツを抽出することを目的としたプロジェクトです。...Education,Text Data,Multiclass Classification,Text Mining Classification
443.28M 430
中国機械翻訳研究会、コーパスデータセット # データセットこのデータセットはTan Lilingによって作成されました。その他(説明で指定)の下で公開されました。# 内容これには...Deep Learning,Computer Science Classification
6.6G 492
スタートレックの脚本、すべての《スタートレック》シリーズの脚本のオリジナルテキスト脚本と処理行 スター・トレックの脚本テキストデータは、http://www.chakoteya.net/StarTrek/index.html のデータからスクレイピングされました。コードはこちら:https://github。...NLP,Movies and TV Shows,Text Data,Text Mining Classification
42.63M 362
ロボット様に登場する単語イベント、F-Societyが好きな流行語を知る 「Mr. Robot」は、データを破壊すること、暗号化すること、削除することなど、すべてデータに関するものです。私はいくつかのデータを掘り起こしたいと思いました。...Arts and Entertainment,Games Classification
0.31M 423