GPT トレーニングコーパス_ChatGPTデータセット_Open Dataset_Payititi-Artificial Intelligence Data Science Community

ChatGPT感情分析、ChatGPTツイート分類 1ヶ月 ChatGPTはテクノロジー界で大きな話題になっています。ChatGPTに関するツイートを1か月間収集した後、感情...NLP Classification

35.27M 1854

Charuni SA

ChatGPT Twitterデータセットこのデータセットには、ハッシュタグ#chatgpt付きのツイートのコレクションが含まれています。これらのツイートはTwitterから収集され、...NLP Classification

0.4M 1662

Muhammad Tariq

ChatGPTに関するツイートデータセットパッケージ ChatGPTはOpenAIによって開発されたチャットボットです。2022年11月に立ち上げられました。このデータセットには#ChatGPTに関するツイートが含まれています...NLP Classification

133.86M 953

Manisha Bhattacharjee

LFQA患者医師対話データ「Diagnose me」とは何ですか？「Diagnose me」は、事実に基づいた会話に基づく患者と医師の対話のLFQAデータセットです...NLP,Medical Classification

433.32M 677

Ahmed

野菜（グーグルWord2Secニュース）野菜（Google Word2Vecニュース）...NLP,News Classification

3.73M 701

Liling Tan

ウィキペディアWord2Vec、Apache Spark word2vecは20万件のウィキペディアページでトレーニングされました私はApache Sparkを使って、20万件の英語版ウィキペディアページから600万以上のフレーズを抽出しました。以下は…のプロセスです。...NLP,Business,Earth and Nature,Text Mining Classification

132.74M 409

Maziyar

Word2vecはウィキペディア上のデータ（単一文字＋二文字）を使って訓練し、ユニグラムとバイグラムを捉えますこれは単語埋め込みモデルであり、ウィキペディア+様々なソースのコメントから作成されました。フレーズベースの手法（隣接する単語のフレーズ/バイグラムの文脈を考慮しない）からバイグラムを作成するのとは異なり、これ...NLP,Computer Science,Software,Programming,Neural Networks Classification

8.62G 408

aintnosunshine

Redditコミュニティの参加度を予測するデータセット、GDELT投稿の分類、およびSiroccoテキスト分析（意見とエンティティの抽出）このデータセットには、3か月間（2017年6月から8月）のRedditのニュース投稿、ならびにGDELTの投稿分類およびSiroccoのテキスト分析（意見とエンティティ抽出）の結果が含まれています。...NLP,Computer Science,Online Communities Classification

174.09M 436

Sergei Sokolenko

ニューヨークタイムズのコメント、《ニューヨークタイムズ》が発表した記事に対するコメントは200万件を超えるニューヨーク・タイムズは幅広い読者層を持ち、人々の意見や時事問題に対する見方を形成する上で重要な役割を果たしています。...NLP,Computer Science,Programming,News Classification

1.55G 394

Aashita Kesarwani

Facebookが公開した300次元の事前学習済みFastText英単語ベクトル Facebookが公開した300次元の事前学習済みFastText英語単語ベクトル。ファイルの最初の行には、nu...NLP,Arts and Entertainment,Games Classification

4.52G 376

Vladimir Demidov

NLP Word2Vec 既存のword2vec埋め込み（グローブやGoogleニュースを含む）は、単語の言語的コンテキストを再構築するように訓練されています。 Word2vecは、単語埋め込みを生成するために使用される関連モデルのグループです。これらのモデルは浅い2層のニュー...NLP,Computer Science Classification

5.89G 381

pkugoodspeed

EmojifyDataデータセット：1800万件の英語のツイートで、すべてが絵文字を含んでいるそれで、私と友人は自然言語処理におけるディープラーニングのIPavlovコースに参加していました。最終プロジェクトとして、私たちは…...NLP,Online Communities,Text Data,Social Networks Classification

2.58G 619

Daniil Larionov

言語生成データセット：2億個のサンプル、言語生成に使用するために処理されたAmazonレビューデータセット Amazon顧客レビューデータセットは、ショッピングウェブサイトAmazonでユーザーが生成した商品レビューのデータセットです。それは含みます...NLP,Business,Deep Learning,Classification,Artificial Intelligence Classification

20.51G 396

Abhishek Chatterjee

Select Language

AI Technology Community

Today search ranking

month_search_ranking

Dataset Category

Open Dataset

Related data classification