Related Search
您是不是在找?
Today ranking
Weekly Best Sellers
Monthly Best Sellers
COVID 19オープンリサーチデータセットの文章クラスタリング
Coronavirus,NLP,Drugs and Medications,Clustering Classification
258.38M
586
Rajasankar Viswanathan
CORD 19知識グラフ
Earth and Nature,Internet,Education,Biology,Coronavirus,NLP Classification
5963.63M
276
Yi-tong Tseo
音声クローンに使用する英語の多話者コーパス CSTR-VCTKコーパス
このCSTR VCTKコーパスには、様々なアクセントを持つ109人の英語ネイティブ話者が発話した音声データが含まれています。各話者...NLP,Audio Data Classification
15.22G
447
Michael Fekadu
言語生成データセット:2億個のサンプル、言語生成に使用するために処理されたAmazonレビューデータセット
Amazon顧客レビューデータセットは、ショッピングウェブサイトAmazonでユーザーが生成した商品レビューのデータセットです。それは含みます...NLP,Business,Deep Learning,Classification,Artificial Intelligence Classification
20.51G
382
Abhishek Chatterjee
EmojifyDataデータセット:1800万件の英語のツイートで、すべてが絵文字を含んでいる
それで、私と友人は自然言語処理におけるディープラーニングのIPavlovコースに参加していました。最終プロジェクトとして、私たちは…...NLP,Online Communities,Text Data,Social Networks Classification
2.58G
599
Daniil Larionov
CONLL2003雑多な単語の再ラベリング
Earth and Nature,NLP,Text Data,Text Mining,spaCy Classification
0.01M
315
chongyixiang
NLP Word2Vec 既存のword2vec埋め込み(グローブやGoogleニュースを含む)は、単語の言語的コンテキストを再構築するように訓練されています。
Word2vecは、単語埋め込みを生成するために使用される関連モデルのグループです。これらのモデルは浅い2層のニュー...NLP,Computer Science Classification
5.89G
365
pkugoodspeed
BioCreativeVI PMトラッキング文書分類タスクにおける訓練モデル
BioCreativeVI-PM-Track文書トリアージタスクにおける学習済みモデル...NLP Classification
2.16G
552
lingluo
Facebookが公開した300次元の事前学習済みFastText英単語ベクトル
Facebookが公開した300次元の事前学習済みFastText英語単語ベクトル。ファイルの最初の行には、nu...NLP,Arts and Entertainment,Games Classification
4.52G
353
Vladimir Demidov
トルコ語で書かれたデータを使って、word2vecまたはn-gramモデルを訓練することができます
このデータにはトルコ語で書かれた各文書が含まれており、ウィキ文書IDも含まれています。あなたはword2vecまたはn-gramモードを学習することができます。...NLP,Text Data,Text Mining Classification
463.02M
526
MustafaKeskin
ニューヨークタイムズのコメント、《ニューヨークタイムズ》が発表した記事に対するコメントは200万件を超える
ニューヨーク・タイムズは幅広い読者層を持ち、人々の意見や時事問題に対する見方を形成する上で重要な役割を果たしています。...NLP,Computer Science,Programming,News Classification
1.55G
371
Aashita Kesarwani
Redditコミュニティの参加度を予測するデータセット、GDELT投稿の分類、およびSiroccoテキスト分析(意見とエンティティの抽出)
このデータセットには、3か月間(2017年6月から8月)のRedditのニュース投稿、ならびにGDELTの投稿分類およびSiroccoのテキスト分析(意見とエンティティ抽出)の結果が含まれています。...NLP,Computer Science,Online Communities Classification
174.09M
420
Sergei Sokolenko
Word2vecはウィキペディア上のデータ(単一文字+二文字)を使って訓練し、ユニグラムとバイグラムを捉えます
これは単語埋め込みモデルであり、ウィキペディア+様々なソースのコメントから作成されました。フレーズベースの手法(隣接する単語のフレーズ/バイグラムの文脈を考慮しない)からバイグラムを作成するのとは異なり、これ...NLP,Computer Science,Software,Programming,Neural Networks Classification
8.62G
388
aintnosunshine
Flickr画像データセット、Flickr画像キャプションデータセット
Flickr30kデータセットは、文章ベースの画像記述の標準ベンチマークとなっています。この論文ではFlickr30...NLP,Image Data,Computer Vision Classification
8.2G
434
Hsankesara
Facebookが公開した300次元の事前学習、Common Crawl上で学習させた200万個の単語ベクトル
Facebookによって公開された300次元の事前学習済みFastText英単語ベクトル。ファイルの最初の行には、nu...NLP,Arts and Entertainment Classification
650M
414
Manish Maharjan