Select Language

Open Dataset

Multi-Domain Sentiment Dataset--マルチドメイン感情データセット 多ドメイン感情データセットには、Amazon.comから取得した多くの商品タイプ(ドメイン)の商品レビューが含まれています。一部のドメイン(書籍やDVD)には何千ものレビューがあります。他のドメイン(楽器)は...NLP Text
1.53M 1211
WMT 2011ニュースクロール機械翻訳データ WMT2011NewsCrawldataは自然言語翻訳データで、Europarlcorpusコーパスから抽出されたもので、以下を含みます:フランス語 - 英語、スペイン語 - 英語、ドイツ語 - 英語(原文未完成、「Ge」の続きがないため仮にドイツ語と推測)...NLP Text
25.01G 894
人民日報品詞付きコーパスデータ(1998年01月) 人民日報のコーパス、形態素解析と品詞タグ付け(POS)のコーパス(単語分割と品詞のための中国語コーパス)リソースは1998年1 - 6月の人民日報に関するものです。...NLP Text
2.81M 1134
250万Reddit投稿データ これは、購読者からの上位2500のサブディレクトリのうち、上位1000の投稿の履歴データセットです。このデータは、2013年8月15日から20日の間にredditから抽出されたものです。これはreddi...NLP Text
452.85M 816
ニュースカテゴリーデータセット、20万件のニュースタイトルを含む このデータセットには、2012年から2018年までにHuffPostから取得した約20万件のニュースタイトルが含まれています。このデータセットで学習させたモデルは、追跡されていないニュース記事のラベルを識別するために使用できます。...NLP Text
25.44M 1323
アイルランド・タイムズニュースデータセット このニュースデータセットは、アイルランド国内の『アイルランド・タイムズ』が発表した148万件の見出しニュースで構成されています。160年前に創設され、この機関はヨーロッパで起こっていることを長期間観察することができます。内容...NLP Text
48.93M 853
PubMed医学データセット:抽出された3984個の医学文が含まれています このデータセットには、PubMedの要約から抽出された3984個の医学文が含まれており、異なる医学用語間の関係が注釈付けされています。このデータセットは主に「治療」と「病因」の関係に焦点を当てています。...NLP Classification
9.4M 1146
Europarl:統計機械翻訳用の並列コーパス(21種類の欧州言語版) このコーパスの詳細な説明については、次を読んでください:ユーロパル:統計的機械翻訳用の並列コーパス...NLP Classification
1.46G 911
単語レベルに基づく英語曲線テキスト検出データセット(TOTAL - TEXT) 合計でこのテキストは1555枚の画像から構成されており、これらの画像には水平、多方向、湾曲(1種)といった3種類以上の異なるテキスト方向があります。データ引用:@article{CK2019,著者}...NLP Classification
441M 830
手書き数字USPSデータセット 手書き数字USPSデータセット。このデータセットには7291枚の訓練画像と2007枚のテスト画像があります。これらの画像は16×16のグレースケールピクセルです。このデータセットはhdf5ファイル形式で提供されます。hdf5...Action/Event Detection Classification
3M 1218
NIST手書きフォームおよび文字データセット NIST手書きフォームおよび文字データベースは英語の手書き文字データで、アメリカ国立標準技術研究所(NIST)によって公開されています。3600人工810についての記述が文脈として不明瞭です。...OCR/Text Detection Classification
2G 688
英文単語識別画像データセット Text Recognitionは文字認識用の画像データで、900万枚の画像が含まれ、画像中には9万個以上の英単語があり、光学文字認識タスク(Optic)に使用できます。...Image Search Classification
9.41G 687
0M 694
機械翻訳データセット MNIST Classification
15G 727
756M 978
WDWデータセット MNIST Classification
26G 648
意味関係分類データセットSemEval2007 - タスク4 タスク4の主なタスクは、単純な名詞(名詞または基本的な名詞句)間の意味関係の分類です。例えば、蜜蜂は、生産者と製品の関係の一例を示しています。この分類...MNIST Classification
133.2M 818
3M 769