2_Open DatasetPayititi-Artificial Intelligence Data Science Community

2020年アメリカ合衆国大統領選挙 Politics,NLP,Text Data Classification

30.88M 289

Radu Stoicescu

NLP Word2Vec 既存のword2vec埋め込み（グローブやGoogleニュースを含む）は、単語の言語的コンテキストを再構築するように訓練されています。 Word2vecは、単語埋め込みを生成するために使用される関連モデルのグループです。これらのモデルは浅い2層のニュー...NLP,Computer Science Classification

5.89G 381

pkugoodspeed

アラビア語Wikiデータダンプ2018 NLP,Languages,Neural Networks Classification

0M 261

Abed Khooli

グローブ6B 200d事前学習済み単語ベクトル Business,NLP Classification

661.31M 368

HypersportR8

トルコ語で書かれたデータを使って、word2vecまたはn-gramモデルを訓練することができますこのデータにはトルコ語で書かれた各文書が含まれており、ウィキ文書IDも含まれています。あなたはword2vecまたはn-gramモードを学習することができます。...NLP,Text Data,Text Mining Classification

463.02M 538

MustafaKeskin

ニューヨークタイムズのコメント、《ニューヨークタイムズ》が発表した記事に対するコメントは200万件を超えるニューヨーク・タイムズは幅広い読者層を持ち、人々の意見や時事問題に対する見方を形成する上で重要な役割を果たしています。...NLP,Computer Science,Programming,News Classification

1.55G 394

Aashita Kesarwani

Word2vecはウィキペディア上のデータ（単一文字＋二文字）を使って訓練し、ユニグラムとバイグラムを捉えますこれは単語埋め込みモデルであり、ウィキペディア+様々なソースのコメントから作成されました。フレーズベースの手法（隣接する単語のフレーズ/バイグラムの文脈を考慮しない）からバイグラムを作成するのとは異なり、これ...NLP,Computer Science,Software,Programming,Neural Networks Classification

8.62G 408

aintnosunshine

律政司2009～2018年の記者発表資料 Earth and Nature,Politics,NLP,Crime,Text Data Classification

52.47M 310

John B

Facebookが公開した300次元の事前学習、Common Crawl上で学習させた200万個の単語ベクトル Facebookによって公開された300次元の事前学習済みFastText英単語ベクトル。ファイルの最初の行には、nu...NLP,Arts and Entertainment Classification

650M 437

Manish Maharjan

ブラジルの科学技術ニュース。データセットにはブラジルのメディアが発表した約2720本のニュースが含まれています。このデータセットは、ニュースとソーシャルメディアの監視を専門とする会社であるミティ・インテリジェンシアによって提供されました...NLP,News,Text Data,Text Mining,Science and Technology Classification

44.47M 328

Miti Inteligência

スタンフォードGloVe 200dデータセットをword2vec形式のデータに変換するスタンフォードのGloVe 200dデータセットはword2vec形式に変換されていますか...NLP,Computer Science Classification

661.31M 697

the kwisatz haderach

ウィキペディアWord2Vec、Apache Spark word2vecは20万件のウィキペディアページでトレーニングされました私はApache Sparkを使って、20万件の英語版ウィキペディアページから600万以上のフレーズを抽出しました。以下は…のプロセスです。...NLP,Business,Earth and Nature,Text Mining Classification

132.74M 409

Maziyar

アラブ詩歌資料集（6 21世紀） NLP,Literature Classification

90.3M 422

Fahd

フランス2019年全国大討論の公開データ 2種類の回答を含む4つの異なるCSVファイル：人々の回答を含む4つのCSVファイル...NLP,Text Data,Economics Classification

1.49G 723

William Jacques

自動車消費者の自動車評価とレビュー、データセットには 62 の主要ブランドのデータが含まれていますこれは消費者の意見と自動車メーカー/モデル/タイプの星評価を含むデータセットです。内容 - 現在...Automobiles and Vehicles,Retail and Shopping,Ratings and Reviews Classification

137.62M 752

AnkurJain

野菜（グーグルWord2Secニュース）野菜（Google Word2Vecニュース）...NLP,News Classification

3.73M 701

Liling Tan

2018年インド政治ニュース Politics,NLP,Text Data,Linguistics,India Classification

57.35M 293

Xen.m.rph

redditベクトルデータセット、sence2vecモデルの訓練に使用 Sence2vec単語埋め込みモデルは、単語からの文脈情報を利用するため、word2vecよりも性能が良い。このre...NLP,Computer Science,Text Data,spaCy Classification

635.76M 438

Poonam Ligade

Stack Overflow 2018問題データセットこのデータセットでは、StackOverflowの質問を探索し、教師なしアルゴリズムを使ってタグを抽出しようと試み、次に…...NLP,Earth and Nature,Computer Science,Multiclass Classification Classification

230.27M 436

Réda

プレノス総督エリ大統領 2018年 NLP,Brazil Classification

16.5M 584

Luiz Amaral

Select Language

AI Technology Community

Today search ranking

month_search_ranking

Dataset Category

Open Dataset