Related data classification
9
534
2
5
9
11
15
2
2
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
実体抽出はPitchforkのレビューから
Business,Arts and Entertainment,Music,Retail and Shopping,NLP,Popular Culture Classification
14.49M
664
Justin K
Mediumの記事には、AI、機械学習、データサイエンスまたは人工知能としてマークされた投稿と、ユーザー情報が含まれています。
ミディアムは世界で最も洞察力に富んだ作家、思想家、ストーリーテラーたちの知恵を引き出し、あなたに最も賢い...NLP,Text Data,Literature Classification
1.8G
366
AiswaryaRamachandran
科学流行レビュー削除
Business,NLP,Text Data,Binary Classification,Bigquery Classification
74.17M
271
areeves87
FakeNewsNet 偽ニュース研究データ収集、偽ニュース、虚偽情報、データマイニング
これは、アリゾナ州立大学(ASU)における偽ニュース研究のための進行中のデータ収集プロジェクトのリポジトリです。私たちは、FakeNを説明し、比較します...NLP,News,Social Science,Social Networks Classification
72.61M
1068
Deepak Mahudeswaran
医学成績表、mtsamplesから取得した医学的転記データ
医療データはHIPAAのプライバシー規制のため極めて見つけにくい。このデータセットは、医療に関する情報を提供することで解決策を提供します。...NLP,Health,Medicine Classification
16.22M
294
Tara Boyle
redditの自己投稿分類タスクには、1000以上の精心選抜されたカテゴリが含まれています。
Reddit自己投稿分類タスク(RSPCT)へようこそ!このデータセットの目的は、面白く大規模な......NLP,Classification,Computer Science,Multiclass Classification Classification
839.37M
317
Mike Swarbrick Jones
NLTKロイターニュースファイル、NLTKロイターコーパス内のすべてのファイル
このデータセットには、NLTKのロイターコーパス内の各ファイルのID、カテゴリ、および生テキストが含まれています。内容 各ファイル(行...NLP,Computer Science,News,Text Data,Text Mining Classification
3.3M
684
Brad Boldenow
アラビア語ULMFiTモデル、Ar Wikipediaコーパスに基づくアラビア語モデル
アラビア語は世界の主要言語であるにもかかわらず、インターネット上では十分に表現されておらず、アラビア語のリソースが不足しています...NLP,Transfer Learning,Languages Classification
160.13M
649
Abed Khooli
ケグルの仕事
Computer Science,Education,NLP,Recommender Systems,Search Engines Classification
0.27M
297
AbdullahAli
ConceptNet Numberbatchベクトル、ConceptNetからの単語ベクトル
これらはコンセプトネット(ConceptNet)プロジェクトによって公開された単語ベクトルです。コンセプトネット(ConceptNet)の本質は三元組です。...NLP Classification
899.91M
342
Nohman
注釈付きGMBコーパス、GMBテキストコーパスの注釈サブセット
GMB(グロニンゲン意味銀行)コーパスを使用した注釈付きコーパスの固有表現認識(英語でのエンティティ分類用)...NLP,Exploratory Data Analysis,Classification,Random Forest Classification
1.52M
347
Shoumik
『シンプソンズ』のセリフ
Arts and Entertainment,NLP,Text Data,Text Mining,Comics and Animation Classification
8.94M
545
Pierre Megret
ウィキペディアの文章、英語版ウィキペディアのダンプから780万の文章が収集されています
ウィキペディアのダンプは巨大なXMLファイルで、あまり有用ではない内容が大量に含まれています。私は何かのためにいくつかの英語のテキストが必要でした...NLP,Text Mining Classification
891.28M
367
Mike Ortman
Redditコメントのスコア予測、NLPを使用してコメントのスコアを予測
このデータセットの背後にあるアイデアは、特定のコメントが高いアップボティングを受けるかダウンボティングを受けるかを予測しようとすることです。ただし、原文が途中で切れているため、文脈が不十分です。...NLP,Computer Science,Social Science Classification
1.8G
309
Evan Hallmark