Related Search
您是不是在找?
Today ranking
Weekly Best Sellers
Monthly Best Sellers
純テキストのウィキペディア。各ファイルにはウィキペディアの記事の集合が含まれています。
ウィキペディアのダンプには大量のマークアップが含まれています。ウィキメディアテキストはマークダウンとHTMLのハイブリッドであり、非常に…...NLP,Computer Science,Text Data,Text Mining Classification
23.71G
294
DavidShapiro
ドイツのニュースデータセット
Computer Science,Internet,Education,Software,News,NLP Classification
726.72M
293
Steven
品酒師が提供したワインのレビューデータを使用して、レビュー中の評論者をテキスト分類で分類する
初心者として自然言語処理について考えています!!データセットは、以下のようなワインのコメントやレビューに関するものです...NLP,Business,News,Text Data,Multiclass Classification,Alcohol Classification
50.35M
639
Subhasree Mohapatra
アラブのニュース記事 アルジャズーラネット
Business,Education,News,NLP,Text Data,Psychology,Text Mining Classification
111.89M
583
Abdelkader Rhouati
バンガロール地区のオンライン食品配送の嗜好
Business,Food,NLP,Text Data,Geospatial Analysis,Jobs and Career Classification
0.23M
267
Ben Roshan 
マルチモーダルな憎悪言語、テキストと画像付きのツイート150,000件、憎悪検出に使用
既存の憎悪発言データセットはテキストデータのみを含んでいます。私たちは新しい手動で注釈付けされたマルチモーダルな憎悪発言データセットを作成しました。このデータセットは150000件のツイートで構成されており、各ツイートは...NLP,Online Communities,Image Data,Multiclass Classification,Social Networks Classification
6.55G
699
Victor Callejas Fuentes
201のStackexchangeサイトからのタグ集合
このデータは、StackExchangeからUmbrella配下の200以上のウェブサイトから抽出されたものです。このデータにはあらゆる可能性が含まれています...NLP,Business,Online Communities,Text Data Classification
16.75M
276
Shiv Kumar Ganesh
短編小説コーパス、エドガー・アラン・ポーの短編小説集
内容 現在のデータセットには、エドガー・アラン・ポーの69編の短編小説の全文が表形式で含まれています。さらに...NLP,Text Data,Literature,Text Mining Classification
1.86M
610
Leandro
電子メール分類NLP
Business,Computer Science,Internet,Email and Messaging,NLP Classification
0.1M
257
Aman Miglani
Redditのデータ量は膨大である
Online Communities,Social Networks,NLP,Basketball Classification
38.72M
524
Prakhar Rathi
CC - 100カンナダ語単言語データセット:Webクローリングデータからの1300万件の単言語データセット
この単言語データセットには、多数のウェブサイトからクロールした約1300万の未洗浄のカンナダ語の文が含まれています。...NLP,Text Data,Languages Classification
3.51G
341
Darshan
文章中の感情、文の中で主な感情を表す文章データ
私は多クラス分類を行うために適切にラベル付けされたデータセットを探していました。私は単に…以上のことをしたいと思っていました。...NLP,Earth and Nature,Text Data,Multiclass Classification Classification
2.15M
315
Ishant
OZON製品カテゴリー
Business,NLP,Text Data,Multiclass Classification,Marketing Classification
181.16M
254
Andrew Bezborodov
AskUbuntuからの意図識別チャットボットコーパス
コンテキスト:https://askubuntu.com からの190の質問と回答。内容:中身は単なる行と列以上のものです...NLP,Artificial Intelligence Classification
0.23M
566
Elvin Aghammadzada