C_Open DatasetPayititi-Artificial Intelligence Data Science Community

hck mlホテル NLP,Text Mining Classification

25.45M 553

Sankalp Sharma

コロナウイルス英国の新聞 Internet,Health,News,Biology,NLP,Healthcare Classification

0.25M 340

JamieWallis

COVID 19オープンリサーチデータセットの文章クラスタリング Coronavirus,NLP,Drugs and Medications,Clustering Classification

258.38M 595

Rajasankar Viswanathan

CORD 19知識グラフ Earth and Nature,Internet,Education,Biology,Coronavirus,NLP Classification

5963.63M 293

Yi-tong Tseo

COVID 19の記事 Education,Coronavirus,NLP Classification

79.6M 279

Yury Kashnitsky

音声クローンに使用する英語の多話者コーパス CSTR-VCTKコーパスこのCSTR VCTKコーパスには、様々なアクセントを持つ109人の英語ネイティブ話者が発話した音声データが含まれています。各話者...NLP,Audio Data Classification

15.22G 460

Michael Fekadu

言語生成データセット：2億個のサンプル、言語生成に使用するために処理されたAmazonレビューデータセット Amazon顧客レビューデータセットは、ショッピングウェブサイトAmazonでユーザーが生成した商品レビューのデータセットです。それは含みます...NLP,Business,Deep Learning,Classification,Artificial Intelligence Classification

20.51G 396

Abhishek Chatterjee

EmojifyDataデータセット：1800万件の英語のツイートで、すべてが絵文字を含んでいるそれで、私と友人は自然言語処理におけるディープラーニングのIPavlovコースに参加していました。最終プロジェクトとして、私たちは…...NLP,Online Communities,Text Data,Social Networks Classification

2.58G 619

Daniil Larionov

CONLL2003雑多な単語の再ラベリング Earth and Nature,NLP,Text Data,Text Mining,spaCy Classification

0.01M 340

chongyixiang

NLP Word2Vec 既存のword2vec埋め込み（グローブやGoogleニュースを含む）は、単語の言語的コンテキストを再構築するように訓練されています。 Word2vecは、単語埋め込みを生成するために使用される関連モデルのグループです。これらのモデルは浅い2層のニュー...NLP,Computer Science Classification

5.89G 381

pkugoodspeed

BioCreativeVI PMトラッキング文書分類タスクにおける訓練モデル BioCreativeVI-PM-Track文書トリアージタスクにおける学習済みモデル...NLP Classification

2.16G 569

lingluo

Facebookが公開した300次元の事前学習済みFastText英単語ベクトル Facebookが公開した300次元の事前学習済みFastText英語単語ベクトル。ファイルの最初の行には、nu...NLP,Arts and Entertainment,Games Classification

4.52G 376

Vladimir Demidov

トルコ語で書かれたデータを使って、word2vecまたはn-gramモデルを訓練することができますこのデータにはトルコ語で書かれた各文書が含まれており、ウィキ文書IDも含まれています。あなたはword2vecまたはn-gramモードを学習することができます。...NLP,Text Data,Text Mining Classification

463.02M 538

MustafaKeskin

CNTK女士からのATIS Business,Earth and Nature,NLP Classification

2.35M 572

kpe

ニューヨークタイムズのコメント、《ニューヨークタイムズ》が発表した記事に対するコメントは200万件を超えるニューヨーク・タイムズは幅広い読者層を持ち、人々の意見や時事問題に対する見方を形成する上で重要な役割を果たしています。...NLP,Computer Science,Programming,News Classification

1.55G 394

Aashita Kesarwani

Redditコミュニティの参加度を予測するデータセット、GDELT投稿の分類、およびSiroccoテキスト分析（意見とエンティティの抽出）このデータセットには、3か月間（2017年6月から8月）のRedditのニュース投稿、ならびにGDELTの投稿分類およびSiroccoのテキスト分析（意見とエンティティ抽出）の結果が含まれています。...NLP,Computer Science,Online Communities Classification

174.09M 436

Sergei Sokolenko

Word2vecはウィキペディア上のデータ（単一文字＋二文字）を使って訓練し、ユニグラムとバイグラムを捉えますこれは単語埋め込みモデルであり、ウィキペディア+様々なソースのコメントから作成されました。フレーズベースの手法（隣接する単語のフレーズ/バイグラムの文脈を考慮しない）からバイグラムを作成するのとは異なり、これ...NLP,Computer Science,Software,Programming,Neural Networks Classification

8.62G 408

aintnosunshine

webmd.comからの避妊製品のレビュー NLP,Healthcare Classification

7.11M 300

nataliele

Flickr画像データセット、Flickr画像キャプションデータセット Flickr30kデータセットは、文章ベースの画像記述の標準ベンチマークとなっています。この論文ではFlickr30...NLP,Image Data,Computer Vision Classification

8.2G 446

Hsankesara

Facebookが公開した300次元の事前学習、Common Crawl上で学習させた200万個の単語ベクトル Facebookによって公開された300次元の事前学習済みFastText英単語ベクトル。ファイルの最初の行には、nu...NLP,Arts and Entertainment Classification

650M 437

Manish Maharjan

Select Language

AI Technology Community

Today search ranking

month_search_ranking

Dataset Category

Open Dataset