Related Search
您是不是在找?
Today ranking
Weekly Best Sellers
Monthly Best Sellers
NLP Word2Vec 既存のword2vec埋め込み(グローブやGoogleニュースを含む)は、単語の言語的コンテキストを再構築するように訓練されています。
Word2vecは、単語埋め込みを生成するために使用される関連モデルのグループです。これらのモデルは浅い2層のニュー...NLP,Computer Science Classification
5.89G
366
pkugoodspeed
トルコ語で書かれたデータを使って、word2vecまたはn-gramモデルを訓練することができます
このデータにはトルコ語で書かれた各文書が含まれており、ウィキ文書IDも含まれています。あなたはword2vecまたはn-gramモードを学習することができます。...NLP,Text Data,Text Mining Classification
463.02M
528
MustafaKeskin
ニューヨークタイムズのコメント、《ニューヨークタイムズ》が発表した記事に対するコメントは200万件を超える
ニューヨーク・タイムズは幅広い読者層を持ち、人々の意見や時事問題に対する見方を形成する上で重要な役割を果たしています。...NLP,Computer Science,Programming,News Classification
1.55G
371
Aashita Kesarwani
Word2vecはウィキペディア上のデータ(単一文字+二文字)を使って訓練し、ユニグラムとバイグラムを捉えます
これは単語埋め込みモデルであり、ウィキペディア+様々なソースのコメントから作成されました。フレーズベースの手法(隣接する単語のフレーズ/バイグラムの文脈を考慮しない)からバイグラムを作成するのとは異なり、これ...NLP,Computer Science,Software,Programming,Neural Networks Classification
8.62G
388
aintnosunshine
Facebookが公開した300次元の事前学習、Common Crawl上で学習させた200万個の単語ベクトル
Facebookによって公開された300次元の事前学習済みFastText英単語ベクトル。ファイルの最初の行には、nu...NLP,Arts and Entertainment Classification
650M
420
Manish Maharjan
ブラジルの科学技術ニュース。データセットにはブラジルのメディアが発表した約2720本のニュースが含まれています。
このデータセットは、ニュースとソーシャルメディアの監視を専門とする会社であるミティ・インテリジェンシアによって提供されました...NLP,News,Text Data,Text Mining,Science and Technology Classification
44.47M
317
Miti Inteligência
スタンフォードGloVe 200dデータセットをword2vec形式のデータに変換する
スタンフォードのGloVe 200dデータセットはword2vec形式に変換されていますか...NLP,Computer Science Classification
661.31M
682
the kwisatz haderach
ウィキペディアWord2Vec、Apache Spark word2vecは20万件のウィキペディアページでトレーニングされました
私はApache Sparkを使って、20万件の英語版ウィキペディアページから600万以上のフレーズを抽出しました。以下は…のプロセスです。...NLP,Business,Earth and Nature,Text Mining Classification
132.74M
392
Maziyar
フランス2019年全国大討論の公開データ
2種類の回答を含む4つの異なるCSVファイル:人々の回答を含む4つのCSVファイル...NLP,Text Data,Economics Classification
1.49G
713
William Jacques
自動車消費者の自動車評価とレビュー、データセットには 62 の主要ブランドのデータが含まれています
これは消費者の意見と自動車メーカー/モデル/タイプの星評価を含むデータセットです。内容 - 現在...Automobiles and Vehicles,Retail and Shopping,Ratings and Reviews Classification
137.62M
737
AnkurJain
redditベクトルデータセット、sence2vecモデルの訓練に使用
Sence2vec単語埋め込みモデルは、単語からの文脈情報を利用するため、word2vecよりも性能が良い。このre...NLP,Computer Science,Text Data,spaCy Classification
635.76M
427
Poonam Ligade
Stack Overflow 2018問題データセット
このデータセットでは、StackOverflowの質問を探索し、教師なしアルゴリズムを使ってタグを抽出しようと試み、次に…...NLP,Earth and Nature,Computer Science,Multiclass Classification Classification
230.27M
414
Réda