Select Language

Open Dataset

Related Search
您是不是在找?
Today ranking
Weekly Best Sellers
Monthly Best Sellers
2020年アメリカ合衆国大統領選挙 Politics,NLP,Text Data Classification
30.88M 278
NLP Word2Vec 既存のword2vec埋め込み(グローブやGoogleニュースを含む)は、単語の言語的コンテキストを再構築するように訓練されています。 Word2vecは、単語埋め込みを生成するために使用される関連モデルのグループです。これらのモデルは浅い2層のニュー...NLP,Computer Science Classification
5.89G 366
アラビア語Wikiデータダンプ2018 NLP,Languages,Neural Networks Classification
0M 248
661.31M 353
トルコ語で書かれたデータを使って、word2vecまたはn-gramモデルを訓練することができます このデータにはトルコ語で書かれた各文書が含まれており、ウィキ文書IDも含まれています。あなたはword2vecまたはn-gramモードを学習することができます。...NLP,Text Data,Text Mining Classification
463.02M 528
ニューヨークタイムズのコメント、《ニューヨークタイムズ》が発表した記事に対するコメントは200万件を超える ニューヨーク・タイムズは幅広い読者層を持ち、人々の意見や時事問題に対する見方を形成する上で重要な役割を果たしています。...NLP,Computer Science,Programming,News Classification
1.55G 371
Word2vecはウィキペディア上のデータ(単一文字+二文字)を使って訓練し、ユニグラムとバイグラムを捉えます これは単語埋め込みモデルであり、ウィキペディア+様々なソースのコメントから作成されました。フレーズベースの手法(隣接する単語のフレーズ/バイグラムの文脈を考慮しない)からバイグラムを作成するのとは異なり、これ...NLP,Computer Science,Software,Programming,Neural Networks Classification
8.62G 388
律政司2009~2018年の記者発表資料 Earth and Nature,Politics,NLP,Crime,Text Data Classification
52.47M 301
Facebookが公開した300次元の事前学習、Common Crawl上で学習させた200万個の単語ベクトル Facebookによって公開された300次元の事前学習済みFastText英単語ベクトル。ファイルの最初の行には、nu...NLP,Arts and Entertainment Classification
650M 420
ブラジルの科学技術ニュース。データセットにはブラジルのメディアが発表した約2720本のニュースが含まれています。 このデータセットは、ニュースとソーシャルメディアの監視を専門とする会社であるミティ・インテリジェンシアによって提供されました...NLP,News,Text Data,Text Mining,Science and Technology Classification
44.47M 317
スタンフォードGloVe 200dデータセットをword2vec形式のデータに変換する スタンフォードのGloVe 200dデータセットはword2vec形式に変換されていますか...NLP,Computer Science Classification
661.31M 682
ウィキペディアWord2Vec、Apache Spark word2vecは20万件のウィキペディアページでトレーニングされました 私はApache Sparkを使って、20万件の英語版ウィキペディアページから600万以上のフレーズを抽出しました。以下は…のプロセスです。...NLP,Business,Earth and Nature,Text Mining Classification
132.74M 392
アラブ詩歌資料集(6 21世紀) NLP,Literature Classification
90.3M 408
フランス2019年全国大討論の公開データ 2種類の回答を含む4つの異なるCSVファイル:人々の回答を含む4つのCSVファイル...NLP,Text Data,Economics Classification
1.49G 713
自動車消費者の自動車評価とレビュー、データセットには 62 の主要ブランドのデータが含まれています これは消費者の意見と自動車メーカー/モデル/タイプの星評価を含むデータセットです。内容 - 現在...Automobiles and Vehicles,Retail and Shopping,Ratings and Reviews Classification
137.62M 737
野菜(グーグルWord2Secニュース) 野菜(Google Word2Vecニュース)...NLP,News Classification
3.73M 680
2018年インド政治ニュース Politics,NLP,Text Data,Linguistics,India Classification
57.35M 282
redditベクトルデータセット、sence2vecモデルの訓練に使用 Sence2vec単語埋め込みモデルは、単語からの文脈情報を利用するため、word2vecよりも性能が良い。このre...NLP,Computer Science,Text Data,spaCy Classification
635.76M 427
Stack Overflow 2018問題データセット このデータセットでは、StackOverflowの質問を探索し、教師なしアルゴリズムを使ってタグを抽出しようと試み、次に…...NLP,Earth and Nature,Computer Science,Multiclass Classification Classification
230.27M 414
プレノス総督 エリ大統領 2018年 NLP,Brazil Classification
16.5M 565