Select Language

Open Dataset

スタンフォード大学Sentiment140感情分析データセット Sentiment140データセットはスタンフォード大学のクラスプロジェクトで生成された感情分析用のデータセットで、データはtwitterから収集されました。この人気のあるデータセットであなたは完...MNIST Classification
77.6M 1107
多領域感情データセット(2.0版) マルチドメイン感情データセットには、Amazon.comの多くの商品タイプ(ドメイン)の商品レビューが含まれています。一部のドメイン(書籍やDVD)には数十万件のレビューがあります。他のドメイン(楽器)にはわずか...MNIST Classification
1.53G 686
5M 633
Twitter感情分析訓練コーパス ツイッターの感情分析データセットには1,578,627件の分類済みツイートが含まれており、各行は、積極的な感情を表す場合は1、消極的な感情を表す場合は0としてラベル付けされています。私はコーパスの1/10を使ってあなたをテストすることをおすすめします。...MNIST Classification
53.8M 875
SMSスパムメール収集データセット、スパムメールまたは合法的なSMSの集合 SMS Spam Corpus v.0.1は、SMSスパム研究のために収集された一連のSMSテキストメッセージのラベル付きデータです。これには、1084と1319のメッセージを含む2つの英語の短いメッセージセットが含まれており、ラベル付けされています。...MNIST Classification
503K 1196
TED平行コーパス TED平行コーパスは多言語平行コーパスで、多言語並列コーパスと単語コーパスを含みます。TED会議のウェブサイトwww.ted.comから世界の109種類の言語を抽出します。多言語の平行...MNIST Classification
872.9M 972
オイラー図学習オープンソースデータセット 本データセットは、2018年10月23日に多カテゴリでダウンサンプリングして得られたユーザーのクリック行動データに基づいて、グラフデータを構築したものです。注:列区切り文字は「||」。ノード番号:グラフデータは2...MNIST Classification
243.41M 557
騰訊AI Labが大規模で高品質な中国語単語ベクトルデータをオープンソース化 騰訊AI Labが今回公開した中国語単語ベクトルデータには800万以上の中国語語彙が含まれており、その中の各単語は200次元のベクトルに対応しています。既存の中国語単語ベクトルデータと比べて、騰訊AI L...NLP,MNIST Classification
39.4G 700
単語と物体を処理する際のfMRI画像データ OpenfMRIデータベース(Poldrackら、2013年;PoldrackとGorgolewski、2015年)は、MRIとEEG技術を用いて収集された脳画像データベースです。それは201...Image Search Classification
3.14G 779
アメリカ手話のアルファベットの画像データセット データセットはアメリカ手話のアルファベット画像の集合で、29個のフォルダに分けられ、それぞれのカテゴリを表しています。トレーニングデータセットには87,000枚の200×200ピクセルの画像が含まれています。29個あります...NLP,Image Search Classification
1.03G 1132
手話数字画像データセット 手話(サイン言語とも呼ばれます)は、手動によるコミュニケーションを使って意味を伝える言語です。これには、同時にジェスチャー、動き、指、腕または体の向き、および顔の表情を用いて伝えることが含まれます...OCR/Text Detection Classification
16.4M 885
20万英語ユーモアテキストデータセット 公開時間:2016年 このデータベースには約208,000個のジョークがあります。現在のデータセットのファイルには、3つのソースからのジョークが含まれています。---------------------------------...OCR/Text Detection Classification
24.57M 849
心霊雞湯テキストデータセット GitHubからの毒チャーミングな文章のテキストデータセットです。このデータはウェブサイト http://www.nows.fun/ のサイトデータです。データ量:1232件。ファイル形式はSQLです。...OCR/Text Detection Classification
125K 1149
人民日報品詞付きコーパスデータ(199801) 人民日報のコーパス、形態素解析と品詞タグ付け(POS)のコーパス(単語分割と品詞のための中国語コーパス)リソースは1998年の人民日報の1 - 6月分...OCR/Text Detection Classification
3.37M 988
中国語手書き数字MNISTデータセット 百人の中国人がデータ収集に参加しました。各参加者は標準的な黒インクのペンを使って全15を書きました。...MNIST Classification,Text
16.7M 900
MNISTデータベース このページから入手できる手書き数字のMNISTデータベースには、60,000個の例からなる訓練セットと、テストセットがあります...MNIST Classification
11M 1110
QMNIST MNISTデータセットを構築するために使用された正確な前処理手順は長い間失われています。これにより、我々には信頼できる方法がなくなりまし...MNIST Classification
20.34M 1039
ファッション - MNIST Fashion - MNISTはザランドの商品画像のデータセットで、6万件の例からなる訓練セットとテストセットで構成されています。...MNIST,Fashion Classification
29.45M 811
マルチMNIST MultiMNISTのトレーニングデータセットとテストデータセットは、同じセットからのある数字を別の数字の上に重ねることで生成されます(tr"...MNIST Classification
43.31M 826