Select Language

Open Dataset

Related data classification

ChatGPT感情分析、ChatGPTツイート分類 1ヶ月 ChatGPTはテクノロジー界で大きな話題になっています。ChatGPTに関するツイートを1か月間収集した後、感情...NLP Classification
35.27M 1808
ChatGPT Twitterデータセット このデータセットには、ハッシュタグ#chatgpt付きのツイートのコレクションが含まれています。これらのツイートはTwitterから収集され、...NLP Classification
0.4M 1623
ChatGPTに関するツイートデータセットパッケージ ChatGPTはOpenAIによって開発されたチャットボットです。2022年11月に立ち上げられました。このデータセットには#ChatGPTに関するツイートが含まれています...NLP Classification
133.86M 923
LFQA患者医師対話データ 「Diagnose me」とは何ですか?「Diagnose me」は、事実に基づいた会話に基づく患者と医師の対話のLFQAデータセットです...NLP,Medical Classification
433.32M 638
野菜(グーグルWord2Secニュース) 野菜(Google Word2Vecニュース)...NLP,News Classification
3.73M 680
ウィキペディアWord2Vec、Apache Spark word2vecは20万件のウィキペディアページでトレーニングされました 私はApache Sparkを使って、20万件の英語版ウィキペディアページから600万以上のフレーズを抽出しました。以下は…のプロセスです。...NLP,Business,Earth and Nature,Text Mining Classification
132.74M 392
Word2vecはウィキペディア上のデータ(単一文字+二文字)を使って訓練し、ユニグラムとバイグラムを捉えます これは単語埋め込みモデルであり、ウィキペディア+様々なソースのコメントから作成されました。フレーズベースの手法(隣接する単語のフレーズ/バイグラムの文脈を考慮しない)からバイグラムを作成するのとは異なり、これ...NLP,Computer Science,Software,Programming,Neural Networks Classification
8.62G 388
Redditコミュニティの参加度を予測するデータセット、GDELT投稿の分類、およびSiroccoテキスト分析(意見とエンティティの抽出) このデータセットには、3か月間(2017年6月から8月)のRedditのニュース投稿、ならびにGDELTの投稿分類およびSiroccoのテキスト分析(意見とエンティティ抽出)の結果が含まれています。...NLP,Computer Science,Online Communities Classification
174.09M 420
ニューヨークタイムズのコメント、《ニューヨークタイムズ》が発表した記事に対するコメントは200万件を超える ニューヨーク・タイムズは幅広い読者層を持ち、人々の意見や時事問題に対する見方を形成する上で重要な役割を果たしています。...NLP,Computer Science,Programming,News Classification
1.55G 371
Facebookが公開した300次元の事前学習済みFastText英単語ベクトル Facebookが公開した300次元の事前学習済みFastText英語単語ベクトル。ファイルの最初の行には、nu...NLP,Arts and Entertainment,Games Classification
4.52G 353
NLP Word2Vec 既存のword2vec埋め込み(グローブやGoogleニュースを含む)は、単語の言語的コンテキストを再構築するように訓練されています。 Word2vecは、単語埋め込みを生成するために使用される関連モデルのグループです。これらのモデルは浅い2層のニュー...NLP,Computer Science Classification
5.89G 365
EmojifyDataデータセット:1800万件の英語のツイートで、すべてが絵文字を含んでいる それで、私と友人は自然言語処理におけるディープラーニングのIPavlovコースに参加していました。最終プロジェクトとして、私たちは…...NLP,Online Communities,Text Data,Social Networks Classification
2.58G 599
言語生成データセット:2億個のサンプル、言語生成に使用するために処理されたAmazonレビューデータセット Amazon顧客レビューデータセットは、ショッピングウェブサイトAmazonでユーザーが生成した商品レビューのデータセットです。それは含みます...NLP,Business,Deep Learning,Classification,Artificial Intelligence Classification
20.51G 382