自然_Open DatasetPayititi-Artificial Intelligence Data Science Community

Goodreadsからの2018年の最高の書籍データ Goodreadsからの2018年の最高の書籍データ...NLP,Image Data,Tabular Data,Literature Classification

81.57M 821

Naren

文献計量学 # データセットこのデータセットはDaniel S. Hainによって作成されました # 内容には以下のファイルが含まれます:...NLP Classification

9.78M 438

Daniel S. Hain

バングラデシュの手書き数字（dot npz形式）ベンガル語手書き数字（.npz形式）このファイルにはNumtaDB：ベンガル語手書き数字（.npz形式）が含まれています。...Image Data Classification

268.7M 641

Yakin

ATISデータセットのクリーニング再開、ATISデータセットのクリーニングとバランス分割 ATISデータセットATISデータセットは、意図分類とスロット埋めタスクとして広く使用される標準的なベンチマークデータセットです...NLP,Classification,Earth and Nature,Computer Science,Health Classification

1.02M 520

kpe

Dmoztools分類データ、芸術、ビジネス、コンピュータ、ゲーム、健康、科学、ショッピング、社会などを含む # データセットこのデータセットはPatanjali Chintalapatiによって作成されました。その他（説明で指定）の条件で公開されています。# 内容それはc...NLP,Text Mining,Websites Classification

279.6M 498

Patanjali Chintalapati

マシャド・デ・アッシスの116部の小説とその他のテキストデータこのリポジトリには、マシャド・デ・アシスの116のフィクション作品やその他のテキストがpdfとtxt形式で収められています...NLP,Business,Literature,Art,Brazil Classification

40.38M 772

Luiz Amaral

Arxivの自然言語処理（NLP）論文とGithubのリンク Education Classification

0.12M 620

Shujian Liu

命名实体認識（NER）は臨床から関心のあるエンティティ（例えば、疾患名、薬剤名）を抽出する問題の説明臨床研究では、臨床記述に文書化された患者の詳細な情報が必要とされることが多い。名前付き...NLP,Health,Health Conditions,Model Comparison,Statistical Analysis,Artificial Intelligence Classification

249.01M 440

Ramashankar Nayak

サンセリフのグーグルフォントで書かれた文字画像データセット # データセットこのデータセットはYeom Jihyeによって作成されました。他のライセンス（説明で指定）の下で公開されています。# 内容これには...NLP,Image Data Classification

768M 548

CheaperThanTires

CoNLL003 命名エンティティ認識（NER）問題のアノテーションデータセットこれは固有表現抽出（NER）問題の注釈付きデータセットです。内容このデータセットはtrain.txt、te...NLP,Arts and Entertainment,Computer Science,Text Data,Games,Text Mining Classification

4.63M 576

AlaaKhaled

有毒な埋め込み物、パズルの有毒コメントチャレンジにおける汎用的な文章符号化テキスト誰もが同じテキストをUniversal Sentence Embeddingでエンコードする必要はありません。このデータセットには...NLP,Deep Learning,Earth and Nature Classification

610.81M 721

Liling Tan

英語の単語頻度、⅓百万のインターネット上で最も一般的な英語の単語このデータセットには、英語のウェブ上で最も一般的に使用される333,333個の単語の出現回数が含まれており、これは...Languages Classification

4.73M 717

Rachael Tatman

スタンフォード自然言語推論 (SNLI) コーパスのJsonl形式これはスタンフォード大学の自然言語推論（snLI）コーパスの1.0版です。このコーパスを使用する場合は、この論文を引用してください：http://nlp.Stanford.edu/pubs/snli...Languages Classification

483.45M 529

John S. Hudzina

NPSチャット，NPSチャットコーパスコンテキストNLTK上の規範的なメタデータ:...Computer Science,Online Communities Classification

2.46M 462

NLTK Data

Mac Morpho、品詞タグ付きのブラジルポルトガル語のニューステキスト NLTKに関する正規メタデータ:packageid=mac_morphoname=MAC-MORPHO:ブラジルポルトガル語のニューステキストと品詞タグ付きwebp...Earth and Nature Classification

10.43M 838

NLTK Data

ベトナム語住所手書きデータセットベトナム語住所手書きデータセット...MNIST Classification

423.81M 458

Mike Truong

DBpediaセマンティックウェブの応用例で、42782編のウィキペディア記事に分類と階層化されたカテゴリが提供されています。 DBpedia（データベースを意味する「DB」から由来）は、ウィキペディアで作成された情報から構造化されたコンテンツを抽出することを目的としたプロジェクトです。...Education,Text Data,Multiclass Classification,Text Mining Classification

443.28M 435

Dan Ofer

中国機械翻訳研究会、コーパスデータセット # データセットこのデータセットはTan Lilingによって作成されました。その他（説明で指定）の下で公開されました。# 内容これには...Deep Learning,Computer Science Classification

6.6G 502

Warmth

スタートレックの脚本、すべての《スタートレック》シリーズの脚本のオリジナルテキスト脚本と処理行スター・トレックの脚本テキストデータは、http://www.chakoteya.net/StarTrek/index.html のデータからスクレイピングされました。コードはこちら：https://github。...NLP,Movies and TV Shows,Text Data,Text Mining Classification

42.63M 373

Gary Broughton

ロボット様に登場する単語イベント、F-Societyが好きな流行語を知る「Mr. Robot」は、データを破壊すること、暗号化すること、削除することなど、すべてデータに関するものです。私はいくつかのデータを掘り起こしたいと思いました。...Arts and Entertainment,Games Classification

0.31M 431

Emma

Select Language

AI Technology Community

Today search ranking

month_search_ranking

Dataset Category

Open Dataset