SMSスパムメール収集データセット、スパムメールまたは合法的なSMSの集合
SMS Spam Corpus v.0.1は、SMSスパム研究のために収集された一連のSMSテキストメッセージのラベル付きデータです。これには、1084と1319のメッセージを含む2つの英語の短いメッセージセットが含まれており、ラベル付けされています。...MNIST Classification
503K
1194
robot
多領域感情データセット(2.0版)
マルチドメイン感情データセットには、Amazon.comの多くの商品タイプ(ドメイン)の商品レビューが含まれています。一部のドメイン(書籍やDVD)には数十万件のレビューがあります。他のドメイン(楽器)にはわずか...MNIST Classification
1.53G
686
robot
スタンフォード大学Sentiment140感情分析データセット
Sentiment140データセットはスタンフォード大学のクラスプロジェクトで生成された感情分析用のデータセットで、データはtwitterから収集されました。この人気のあるデータセットであなたは完...MNIST Classification
77.6M
1106
robot
中文繁体字分詞データセット UD-Chinese-GSD
ユニバーサル・依存構造解析(Universal Dependencies)は、複数の言語に対して言語を超えて一貫した木構造データベース(樹庫)のアノテーションを開発することを目的としたプロジェクトであり、その目標は多言語解析器の開発や言語を超えた学習を促進することである...MNIST Classification
400.17M
726
robot
MSParS (V1.0):知識ベースの質疑応答に用いる多視点意味解析データセット
MSParSはオープンドメインの意味解析タスクに使用される大規模なデータセットです。データセット全体は81,826個のサンプルで構成されており、これらのサンプルは英語を母語とする人々によってアノテーションされています。私たちは...MNIST Classification
4.94M
613
robot
Chinese Word Analogy Lists 漢語語彙類比データセット
ほとんどの単語埋め込み手法は単語を基本単位として、単語の外部コンテキストに基づいて埋め込みを学習します。...MNIST Classification
121.1M
621
robot
常識問答テキストデータセット(CommonsenseQA)
CommonsenseQAは、正解を予測するためにさまざまな種類の常識知識を必要とする新しい選択式の質問応答データセットです。これは12,102個の質問を含み、その中には1つの正解があります。...MNIST Classification
1.04M
1417
Tel-Aviv University
中国語の事前学習済み単語ベクトルデータセット
このプロジェクトでは、異なる表現(疎表現と密表現)、文脈特徴(単語、n-gram、文字など)、およびコーパスで学習した中国語の単語ベクトル(埋め込み)を使用することができます。ここでは、あなたは...MNIST Classification
354K
680
robot
多言語概念辞書
(1)中国語概念辞書(Chinese Concept Dictionary、CCD)はWordNet1.6版の英語概念に対する中国語の対応付けを実現し、概念の総数は約10万に近い(その中の語)...MNIST Classification
7.8M
550
robot
現代漢語文法情報辞書
現代中国語文法情報辞書、約8万語の360万項目の文法属性記述を含む。データ引用:@data{DVN/EDQWIL_2017,著者={Yu,ShiwenとZhu,Xuefeng},公開...MNIST Classification
68.5M
633
robot
AI2推論チャレンジ(ARC)2018データセット
ARCデータセットには、様々なソースから抽出された7,787の科学試験問題が含まれており、その中にはAI2の関連研究パートナーからライセンスを得て提供された科学問題も含まれています。これらは純粋なテキストの英語の試験問題です。...MNIST Classification
649.3M
680
robot
10万+知恵の谷(知乎)ユーザーデータセット
北京大学オープン研究データプラットフォームから、scrapyをツールとして利用し、知恵(知乎)プラットフォーム上の10万余りのユーザー個人ホームページデータを収集し、ユーザーの性別、所在地、個性を網羅しています。...MNIST Classification
204.6M
671
北京大学开放研究数据平台