Select Language

Open Dataset

Related Search
您是不是在找?
Today ranking
Weekly Best Sellers
Monthly Best Sellers
hck mlホテル NLP,Text Mining Classification
25.45M 537
コロナウイルス 英国の新聞 Internet,Health,News,Biology,NLP,Healthcare Classification
0.25M 329
COVID 19オープンリサーチデータセットの文章クラスタリング Coronavirus,NLP,Drugs and Medications,Clustering Classification
258.38M 586
CORD 19知識グラフ Earth and Nature,Internet,Education,Biology,Coronavirus,NLP Classification
5963.63M 276
COVID 19の記事 Education,Coronavirus,NLP Classification
79.6M 265
音声クローンに使用する英語の多話者コーパス CSTR-VCTKコーパス このCSTR VCTKコーパスには、様々なアクセントを持つ109人の英語ネイティブ話者が発話した音声データが含まれています。各話者...NLP,Audio Data Classification
15.22G 447
言語生成データセット:2億個のサンプル、言語生成に使用するために処理されたAmazonレビューデータセット Amazon顧客レビューデータセットは、ショッピングウェブサイトAmazonでユーザーが生成した商品レビューのデータセットです。それは含みます...NLP,Business,Deep Learning,Classification,Artificial Intelligence Classification
20.51G 382
EmojifyDataデータセット:1800万件の英語のツイートで、すべてが絵文字を含んでいる それで、私と友人は自然言語処理におけるディープラーニングのIPavlovコースに参加していました。最終プロジェクトとして、私たちは…...NLP,Online Communities,Text Data,Social Networks Classification
2.58G 599
CONLL2003雑多な単語の再ラベリング Earth and Nature,NLP,Text Data,Text Mining,spaCy Classification
0.01M 315
NLP Word2Vec 既存のword2vec埋め込み(グローブやGoogleニュースを含む)は、単語の言語的コンテキストを再構築するように訓練されています。 Word2vecは、単語埋め込みを生成するために使用される関連モデルのグループです。これらのモデルは浅い2層のニュー...NLP,Computer Science Classification
5.89G 365
BioCreativeVI PMトラッキング文書分類タスクにおける訓練モデル BioCreativeVI-PM-Track文書トリアージタスクにおける学習済みモデル...NLP Classification
2.16G 552
Facebookが公開した300次元の事前学習済みFastText英単語ベクトル Facebookが公開した300次元の事前学習済みFastText英語単語ベクトル。ファイルの最初の行には、nu...NLP,Arts and Entertainment,Games Classification
4.52G 353
トルコ語で書かれたデータを使って、word2vecまたはn-gramモデルを訓練することができます このデータにはトルコ語で書かれた各文書が含まれており、ウィキ文書IDも含まれています。あなたはword2vecまたはn-gramモードを学習することができます。...NLP,Text Data,Text Mining Classification
463.02M 526
CNTK女士からのATIS Business,Earth and Nature,NLP Classification
2.35M 559
ニューヨークタイムズのコメント、《ニューヨークタイムズ》が発表した記事に対するコメントは200万件を超える ニューヨーク・タイムズは幅広い読者層を持ち、人々の意見や時事問題に対する見方を形成する上で重要な役割を果たしています。...NLP,Computer Science,Programming,News Classification
1.55G 371
Redditコミュニティの参加度を予測するデータセット、GDELT投稿の分類、およびSiroccoテキスト分析(意見とエンティティの抽出) このデータセットには、3か月間(2017年6月から8月)のRedditのニュース投稿、ならびにGDELTの投稿分類およびSiroccoのテキスト分析(意見とエンティティ抽出)の結果が含まれています。...NLP,Computer Science,Online Communities Classification
174.09M 420
Word2vecはウィキペディア上のデータ(単一文字+二文字)を使って訓練し、ユニグラムとバイグラムを捉えます これは単語埋め込みモデルであり、ウィキペディア+様々なソースのコメントから作成されました。フレーズベースの手法(隣接する単語のフレーズ/バイグラムの文脈を考慮しない)からバイグラムを作成するのとは異なり、これ...NLP,Computer Science,Software,Programming,Neural Networks Classification
8.62G 388
webmd.comからの避妊製品のレビュー NLP,Healthcare Classification
7.11M 290
Flickr画像データセット、Flickr画像キャプションデータセット Flickr30kデータセットは、文章ベースの画像記述の標準ベンチマークとなっています。この論文ではFlickr30...NLP,Image Data,Computer Vision Classification
8.2G 434
Facebookが公開した300次元の事前学習、Common Crawl上で学習させた200万個の単語ベクトル Facebookによって公開された300次元の事前学習済みFastText英単語ベクトル。ファイルの最初の行には、nu...NLP,Arts and Entertainment Classification
650M 414