Related data classification
13
ChatGPT感情分析、ChatGPTツイート分類 1ヶ月
ChatGPTはテクノロジー界で大きな話題になっています。ChatGPTに関するツイートを1か月間収集した後、感情...NLP Classification
35.27M
1808
Charuni SA
ChatGPT Twitterデータセット
このデータセットには、ハッシュタグ#chatgpt付きのツイートのコレクションが含まれています。これらのツイートはTwitterから収集され、...NLP Classification
0.4M
1623
Muhammad Tariq
ChatGPTに関するツイートデータセットパッケージ
ChatGPTはOpenAIによって開発されたチャットボットです。2022年11月に立ち上げられました。このデータセットには#ChatGPTに関するツイートが含まれています...NLP Classification
133.86M
923
Manisha Bhattacharjee
LFQA患者医師対話データ
「Diagnose me」とは何ですか?「Diagnose me」は、事実に基づいた会話に基づく患者と医師の対話のLFQAデータセットです...NLP,Medical Classification
433.32M
638
Ahmed
ウィキペディアWord2Vec、Apache Spark word2vecは20万件のウィキペディアページでトレーニングされました
私はApache Sparkを使って、20万件の英語版ウィキペディアページから600万以上のフレーズを抽出しました。以下は…のプロセスです。...NLP,Business,Earth and Nature,Text Mining Classification
132.74M
392
Maziyar
Word2vecはウィキペディア上のデータ(単一文字+二文字)を使って訓練し、ユニグラムとバイグラムを捉えます
これは単語埋め込みモデルであり、ウィキペディア+様々なソースのコメントから作成されました。フレーズベースの手法(隣接する単語のフレーズ/バイグラムの文脈を考慮しない)からバイグラムを作成するのとは異なり、これ...NLP,Computer Science,Software,Programming,Neural Networks Classification
8.62G
388
aintnosunshine
Redditコミュニティの参加度を予測するデータセット、GDELT投稿の分類、およびSiroccoテキスト分析(意見とエンティティの抽出)
このデータセットには、3か月間(2017年6月から8月)のRedditのニュース投稿、ならびにGDELTの投稿分類およびSiroccoのテキスト分析(意見とエンティティ抽出)の結果が含まれています。...NLP,Computer Science,Online Communities Classification
174.09M
420
Sergei Sokolenko
ニューヨークタイムズのコメント、《ニューヨークタイムズ》が発表した記事に対するコメントは200万件を超える
ニューヨーク・タイムズは幅広い読者層を持ち、人々の意見や時事問題に対する見方を形成する上で重要な役割を果たしています。...NLP,Computer Science,Programming,News Classification
1.55G
371
Aashita Kesarwani
Facebookが公開した300次元の事前学習済みFastText英単語ベクトル
Facebookが公開した300次元の事前学習済みFastText英語単語ベクトル。ファイルの最初の行には、nu...NLP,Arts and Entertainment,Games Classification
4.52G
353
Vladimir Demidov
NLP Word2Vec 既存のword2vec埋め込み(グローブやGoogleニュースを含む)は、単語の言語的コンテキストを再構築するように訓練されています。
Word2vecは、単語埋め込みを生成するために使用される関連モデルのグループです。これらのモデルは浅い2層のニュー...NLP,Computer Science Classification
5.89G
365
pkugoodspeed
EmojifyDataデータセット:1800万件の英語のツイートで、すべてが絵文字を含んでいる
それで、私と友人は自然言語処理におけるディープラーニングのIPavlovコースに参加していました。最終プロジェクトとして、私たちは…...NLP,Online Communities,Text Data,Social Networks Classification
2.58G
599
Daniil Larionov
言語生成データセット:2億個のサンプル、言語生成に使用するために処理されたAmazonレビューデータセット
Amazon顧客レビューデータセットは、ショッピングウェブサイトAmazonでユーザーが生成した商品レビューのデータセットです。それは含みます...NLP,Business,Deep Learning,Classification,Artificial Intelligence Classification
20.51G
382
Abhishek Chatterjee