記述可能なテクスチャデータセット(DTD)は、コンピュータビジョンコミュニティが研究目的で使用できます
私たちが画像の内容を生き生きと描写する能力は、人間の視覚システムの力を明確に示しています。...Others Classification
1.17G
339
JMExpert
品酒師が提供したワインのレビューデータを使用して、レビュー中の評論者をテキスト分類で分類する
初心者として自然言語処理について考えています!!データセットは、以下のようなワインのコメントやレビューに関するものです...NLP,Business,News,Text Data,Multiclass Classification,Alcohol Classification
50.35M
639
Subhasree Mohapatra
マルチモーダルな憎悪言語、テキストと画像付きのツイート150,000件、憎悪検出に使用
既存の憎悪発言データセットはテキストデータのみを含んでいます。私たちは新しい手動で注釈付けされたマルチモーダルな憎悪発言データセットを作成しました。このデータセットは150000件のツイートで構成されており、各ツイートは...NLP,Online Communities,Image Data,Multiclass Classification,Social Networks Classification
6.55G
699
Victor Callejas Fuentes
言語ラベル付きのテキストデータ。言語検出に使用できます。
言語検出データセット 言語ラベル付きのテキストデータ。言語検出に使用できます。...NLP,Classification,Computer Science,Multiclass Classification,Languages Classification
31.7M
635
Ishant
テストケースデータセット、ソフトウェアテストで使用されるサンプルデータセットの集合
NLPやコンピュータビジョンなど、さまざまな機械学習タスクに利用可能な多数のデータセットがあります。しかし、私は...NLP,Deep Learning,Earth and Nature Classification
1.3M
371
sapal6
Tanglish感情分析ツイートでは、ツイートの感情を表すために4つのラベルを使用しています
それはすべて、私があるプロジェクトに使うためにローマ字表記の虐待的なタミル語のツイートを探していたときに始まりました。そして、代わりに...NLP,Deep Learning,Online Communities,People Classification
0.85M
296
vyom bhatia
wallstreetbetsなどのSubredditデータは、事後的な定量取引アルゴリズムの感情分析に使用されます。
r/wallstreetbets、r/investing、r/options、r/SecurityAnalysisの各サブレディットに投稿されたすべての投稿は、...NLP,Online Communities,Investing Classification
1.49G
294
Sheridan Green
ELI5スコアラーの訓練データ原型816000例、評価モデルの作成に使用
ELI5は「5歳児に説明するように」を意味します。これはもともと、Redditのeli5サブレディットから収集された、自由形式の長い質問と回答です。...NLP,Earth and Nature,Arts and Entertainment,Education,Social Science,Sports,Regression,Transformers Classification
672.61M
306
Neuron Engineer
皮肉(サーカズム)検出に使用するニュースタイトルデータセット、皮肉と偽ニュース検出タスクに使用する高品質データセット
皮肉検出に関する過去の研究では、主にハッシュタグに基づく監督を用いて収集されたTwitterデータセットを利用していますが、そのような...NLP,Deep Learning,Classification,Earth and Nature,Computer Science,Programming Classification
11.13M
337
Rishabh Misra
OSCARネパール語コーパス、ネパール語テキストコーパス、NLPの教師なし言語モデルの訓練に使用
これらのファイルは[OSCARコーパス](https://oscar-corpus.com/)からのものです。詳細な情報については、彼らのサイトを訪問してください。このデータセットは...NLP,Computer Science,Movies and TV Shows,Text Data,Languages Classification
3.1G
366
Prabesh Dhakal
音声クローンに使用する英語の多話者コーパス CSTR-VCTKコーパス
このCSTR VCTKコーパスには、様々なアクセントを持つ109人の英語ネイティブ話者が発話した音声データが含まれています。各話者...NLP,Audio Data Classification
15.22G
447
Michael Fekadu