Select Language

Open Dataset

Related Search
您是不是在找?
Today ranking
Weekly Best Sellers
Monthly Best Sellers
純テキストのウィキペディア。各ファイルにはウィキペディアの記事の集合が含まれています。 ウィキペディアのダンプには大量のマークアップが含まれています。ウィキメディアテキストはマークダウンとHTMLのハイブリッドであり、非常に…...NLP,Computer Science,Text Data,Text Mining Classification
23.71G 294
ドイツのニュースデータセット Computer Science,Internet,Education,Software,News,NLP Classification
726.72M 293
品酒師が提供したワインのレビューデータを使用して、レビュー中の評論者をテキスト分類で分類する 初心者として自然言語処理について考えています!!データセットは、以下のようなワインのコメントやレビューに関するものです...NLP,Business,News,Text Data,Multiclass Classification,Alcohol Classification
50.35M 639
アラブのニュース記事 アルジャズーラネット Business,Education,News,NLP,Text Data,Psychology,Text Mining Classification
111.89M 583
バンガロール地区のオンライン食品配送の嗜好 Business,Food,NLP,Text Data,Geospatial Analysis,Jobs and Career Classification
0.23M 267
マルチモーダルな憎悪言語、テキストと画像付きのツイート150,000件、憎悪検出に使用 既存の憎悪発言データセットはテキストデータのみを含んでいます。私たちは新しい手動で注釈付けされたマルチモーダルな憎悪発言データセットを作成しました。このデータセットは150000件のツイートで構成されており、各ツイートは...NLP,Online Communities,Image Data,Multiclass Classification,Social Networks Classification
6.55G 699
201のStackexchangeサイトからのタグ集合 このデータは、StackExchangeからUmbrella配下の200以上のウェブサイトから抽出されたものです。このデータにはあらゆる可能性が含まれています...NLP,Business,Online Communities,Text Data Classification
16.75M 276
名称言語 Email and Messaging,NLP,Deep Learning,LSTM Classification
0.16M 232
短編小説コーパス、エドガー・アラン・ポーの短編小説集 内容 現在のデータセットには、エドガー・アラン・ポーの69編の短編小説の全文が表形式で含まれています。さらに...NLP,Text Data,Literature,Text Mining Classification
1.86M 610
電子メール分類NLP Business,Computer Science,Internet,Email and Messaging,NLP Classification
0.1M 257
アラビア語RTニュースタイトル20200419 News,NLP,Text Data,Languages Classification
88.17M 244
Redditのデータ量は膨大である Online Communities,Social Networks,NLP,Basketball Classification
38.72M 524
CC - 100カンナダ語単言語データセット:Webクローリングデータからの1300万件の単言語データセット この単言語データセットには、多数のウェブサイトからクロールした約1300万の未洗浄のカンナダ語の文が含まれています。...NLP,Text Data,Languages Classification
3.51G 341
文章中の感情、文の中で主な感情を表す文章データ 私は多クラス分類を行うために適切にラベル付けされたデータセットを探していました。私は単に…以上のことをしたいと思っていました。...NLP,Earth and Nature,Text Data,Multiclass Classification Classification
2.15M 315
四元 2.0 NLP,Deep Learning,Brazil Classification
74.9M 275
ケネディ大学でのスピーチ NLP,Text Data,Websites Classification
7.5M 221
OZON製品カテゴリー Business,NLP,Text Data,Multiclass Classification,Marketing Classification
181.16M 254
AskUbuntuからの意図識別チャットボットコーパス コンテキスト:https://askubuntu.com からの190の質問と回答。内容:中身は単なる行と列以上のものです...NLP,Artificial Intelligence Classification
0.23M 566
シアムルパリベンガル語フォント NLP,International Relations Classification
0.38M 255
チームデータセット(csv) Transportation,NLP Classification
72.43M 273