8_Open DatasetPayititi-Artificial Intelligence Data Science Community

HPAv18型RGBY.csvファイル Others Classification

2.62M 497

Brie M

HPAv18.csvファイル Internet Classification

2.64M 299

Brie M

1901 - 2018年オランダの歴史的な天気 History,Weather and Climate Classification

191.71M 396

Anika

バンガロール事故データ（2018） News Classification

0.14M 389

AKSHAY

2018年4月21日までのカルナタカ州の会社データ Others Classification

33.24M 433

Aparna H S

2018年学校調査 Education,Primary and Secondary Schools Classification

3.16M 357

Fernando

Steam公式サイトの約80000本のゲームデータセットこれはデータセットで、Steam公式サイトからの約80000のゲームに関する、スクレイピング可能なあらゆる情報を含んでいます。ほとんどの列には、あなたにより良い...Video Games,Games Classification

98.8M 964

Deepan.N

28種類の言語における停止語、自然言語処理におけるテキスト前処理ストップワードは、どの言語においても文に大きな意味を追加しない単語です。それらは安全に無視することができます...NLP,Computer Science,Text Data,Languages Classification

0.09M 637

Heeral Dedhia

日本語 - 英語字幕コーパス（JESC）[クリーニング済み]、280万文からなる大規模なコーパスこのデータセットは、誤字の英単語を修正し、次の方法で単語分割を行うことによって作成された、JESCのクリーン版です。英語 = ...NLP,Business,Computer Science,Languages Classification

220.08M 346

Wahyu Setianto

ELI5スコアラーの訓練データ原型816000例、評価モデルの作成に使用 ELI5は「5歳児に説明するように」を意味します。これはもともと、Redditのeli5サブレディットから収集された、自由形式の長い質問と回答です。...NLP,Earth and Nature,Arts and Entertainment,Education,Social Science,Sports,Regression,Transformers Classification

672.61M 325

Neuron Engineer

arxivデータセット、過去18か月間のアーカイブデータセットアーキブデータセット過去18か月間のアーキブデータセット...NLP Classification

94.28M 641

Rough Rider 404

ウィキペディアからの800万個のドイツ語の文 Internet,NLP,Text Data Classification

1099.53M 257

Benjamin Minixhofer

図8 マークテキストデータセット NLP Classification

4.19M 272

Manuel Benedicto

変圧器 2.8.0 Computer Science,Movies and TV Shows,NLP Classification

7.71M 658

HyeongChan Kim

TOI 2018ニュース記事 Computer Science,Internet,News,Social Science,NLP,Deep Learning Classification

267.42M 639

PulpAI

EmojifyDataデータセット：1800万件の英語のツイートで、すべてが絵文字を含んでいるそれで、私と友人は自然言語処理におけるディープラーニングのIPavlovコースに参加していました。最終プロジェクトとして、私たちは…...NLP,Online Communities,Text Data,Social Networks Classification

2.58G 619

Daniil Larionov

アラビア語Wikiデータダンプ2018 NLP,Languages,Neural Networks Classification

0M 261

Abed Khooli

律政司2009～2018年の記者発表資料 Earth and Nature,Politics,NLP,Crime,Text Data Classification

52.47M 310

John B

ウィキペディアの文章、英語版ウィキペディアのダンプから780万の文章が収集されていますウィキペディアのダンプは巨大なXMLファイルで、あまり有用ではない内容が大量に含まれています。私は何かのためにいくつかの英語のテキストが必要でした...NLP,Text Mining Classification

891.28M 387

Mike Ortman

2018年インド政治ニュース Politics,NLP,Text Data,Linguistics,India Classification

57.35M 293

Xen.m.rph

Select Language

AI Technology Community

Today search ranking

month_search_ranking

Dataset Category

Open Dataset