Select Language

Open Dataset

OZON製品カテゴリー Business,NLP,Text Data,Multiclass Classification,Marketing Classification
181.16M 254
ケネディ大学でのスピーチ NLP,Text Data,Websites Classification
7.5M 221
四元 2.0 NLP,Deep Learning,Brazil Classification
74.9M 275
文章中の感情、文の中で主な感情を表す文章データ 私は多クラス分類を行うために適切にラベル付けされたデータセットを探していました。私は単に…以上のことをしたいと思っていました。...NLP,Earth and Nature,Text Data,Multiclass Classification Classification
2.15M 315
CC - 100カンナダ語単言語データセット:Webクローリングデータからの1300万件の単言語データセット この単言語データセットには、多数のウェブサイトからクロールした約1300万の未洗浄のカンナダ語の文が含まれています。...NLP,Text Data,Languages Classification
3.51G 341
Redditのデータ量は膨大である Online Communities,Social Networks,NLP,Basketball Classification
38.72M 524
アラビア語RTニュースタイトル20200419 News,NLP,Text Data,Languages Classification
88.17M 244
電子メール分類NLP Business,Computer Science,Internet,Email and Messaging,NLP Classification
0.1M 257
短編小説コーパス、エドガー・アラン・ポーの短編小説集 内容 現在のデータセットには、エドガー・アラン・ポーの69編の短編小説の全文が表形式で含まれています。さらに...NLP,Text Data,Literature,Text Mining Classification
1.86M 610
名称言語 Email and Messaging,NLP,Deep Learning,LSTM Classification
0.16M 232
201のStackexchangeサイトからのタグ集合 このデータは、StackExchangeからUmbrella配下の200以上のウェブサイトから抽出されたものです。このデータにはあらゆる可能性が含まれています...NLP,Business,Online Communities,Text Data Classification
16.75M 276
マルチモーダルな憎悪言語、テキストと画像付きのツイート150,000件、憎悪検出に使用 既存の憎悪発言データセットはテキストデータのみを含んでいます。私たちは新しい手動で注釈付けされたマルチモーダルな憎悪発言データセットを作成しました。このデータセットは150000件のツイートで構成されており、各ツイートは...NLP,Online Communities,Image Data,Multiclass Classification,Social Networks Classification
6.55G 699
バンガロール地区のオンライン食品配送の嗜好 Business,Food,NLP,Text Data,Geospatial Analysis,Jobs and Career Classification
0.23M 267
アラブのニュース記事 アルジャズーラネット Business,Education,News,NLP,Text Data,Psychology,Text Mining Classification
111.89M 583
品酒師が提供したワインのレビューデータを使用して、レビュー中の評論者をテキスト分類で分類する 初心者として自然言語処理について考えています!!データセットは、以下のようなワインのコメントやレビューに関するものです...NLP,Business,News,Text Data,Multiclass Classification,Alcohol Classification
50.35M 639
ドイツのニュースデータセット Computer Science,Internet,Education,Software,News,NLP Classification
726.72M 293
純テキストのウィキペディア。各ファイルにはウィキペディアの記事の集合が含まれています。 ウィキペディアのダンプには大量のマークアップが含まれています。ウィキメディアテキストはマークダウンとHTMLのハイブリッドであり、非常に…...NLP,Computer Science,Text Data,Text Mining Classification
23.71G 294
WebMD薬剤レビューデータセット、様々な薬剤のユーザーレビューデータセット このデータセットは、特定の薬剤に関するユーザーレビューを、関連する症状、副作用、年齢、性別、および評価とともに提供します...NLP,Computer Science,Education,Tabular Data,Drugs and Medications Classification
168.58M 308
条件付きのコメント中のラベル付きとラベル無しの文を含むデータセット このデータセットは私の博士号取得中に(http://www.tdg-seville.info/fogallego/Personal%20Info)セビリア大学で作成されました。...NLP,Text Data,Universities and Colleges,Ratings and Reviews Classification
794.68M 591
拗口令データセット、拗口令付きのデータセット(英語) これは主にウェブスクレイピングから収集された(英語の)早口言葉から構成されるデータセットです。このデータセットには約600......NLP,TensorFlow,Languages Classification
0.16M 293