Select Language

Open Dataset

Related Search
Today ranking
Weekly Best Sellers
Monthly Best Sellers
言語ラベル付きのテキストデータ。言語検出に使用できます。 言語検出データセット 言語ラベル付きのテキストデータ。言語検出に使用できます。...NLP,Classification,Computer Science,Multiclass Classification,Languages Classification
31.7M 635
テストケースデータセット、ソフトウェアテストで使用されるサンプルデータセットの集合 NLPやコンピュータビジョンなど、さまざまな機械学習タスクに利用可能な多数のデータセットがあります。しかし、私は...NLP,Deep Learning,Earth and Nature Classification
1.3M 371
Tanglish感情分析ツイートでは、ツイートの感情を表すために4つのラベルを使用しています それはすべて、私があるプロジェクトに使うためにローマ字表記の虐待的なタミル語のツイートを探していたときに始まりました。そして、代わりに...NLP,Deep Learning,Online Communities,People Classification
0.85M 295
wallstreetbetsなどのSubredditデータは、事後的な定量取引アルゴリズムの感情分析に使用されます。 r/wallstreetbets、r/investing、r/options、r/SecurityAnalysisの各サブレディットに投稿されたすべての投稿は、...NLP,Online Communities,Investing Classification
1.49G 294
ELI5スコアラーの訓練データ原型816000例、評価モデルの作成に使用 ELI5は「5歳児に説明するように」を意味します。これはもともと、Redditのeli5サブレディットから収集された、自由形式の長い質問と回答です。...NLP,Earth and Nature,Arts and Entertainment,Education,Social Science,Sports,Regression,Transformers Classification
672.61M 306
皮肉(サーカズム)検出に使用するニュースタイトルデータセット、皮肉と偽ニュース検出タスクに使用する高品質データセット 皮肉検出に関する過去の研究では、主にハッシュタグに基づく監督を用いて収集されたTwitterデータセットを利用していますが、そのような...NLP,Deep Learning,Classification,Earth and Nature,Computer Science,Programming Classification
11.13M 337
OSCARネパール語コーパス、ネパール語テキストコーパス、NLPの教師なし言語モデルの訓練に使用 これらのファイルは[OSCARコーパス](https://oscar-corpus.com/)からのものです。詳細な情報については、彼らのサイトを訪問してください。このデータセットは...NLP,Computer Science,Movies and TV Shows,Text Data,Languages Classification
3.1G 366
音声クローンに使用する英語の多話者コーパス CSTR-VCTKコーパス このCSTR VCTKコーパスには、様々なアクセントを持つ109人の英語ネイティブ話者が発話した音声データが含まれています。各話者...NLP,Audio Data Classification
15.22G 446
言語生成データセット:2億個のサンプル、言語生成に使用するために処理されたAmazonレビューデータセット Amazon顧客レビューデータセットは、ショッピングウェブサイトAmazonでユーザーが生成した商品レビューのデータセットです。それは含みます...NLP,Business,Deep Learning,Classification,Artificial Intelligence Classification
20.51G 382
0M 301
SAVEEデータベース:感情認識システムに使用される音声感情アノテーションデータ SAVEEデータベースは、4人の英語を母語とする男性話者(DC、JE、JK、KLと識別される)から収録された、大学院生...NLP,Business,Social Science Classification
162.57M 497
Redditコメントのスコア予測、NLPを使用してコメントのスコアを予測 このデータセットの背後にあるアイデアは、特定のコメントが高いアップボティングを受けるかダウンボティングを受けるかを予測しようとすることです。ただし、原文が途中で切れているため、文脈が不十分です。...NLP,Computer Science,Social Science Classification
1.8G 309
二元感情分析に使用するIMBD映画レビュー Movies and TV Shows,Retail and Shopping,NLP Classification
31.42M 312
redditベクトルデータセット、sence2vecモデルの訓練に使用 Sence2vec単語埋め込みモデルは、単語からの文脈情報を利用するため、word2vecよりも性能が良い。このre...NLP,Computer Science,Text Data,spaCy Classification
635.76M 427
ScanReferデータ:自然言語を使用してRGB - Dスキャン内で3Dオブジェクトを位置特定する 序論我々は、自然言語記述を用いたRGB-Dスキャンにおける3D物体の位置特定タスクを紹介します。入力として...Others Classification
58.59M 700