Related data classification
9
534
2
5
9
11
15
2
2
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
Chinese Word Analogy Lists 漢語語彙類比データセット
ほとんどの単語埋め込み手法は単語を基本単位として、単語の外部コンテキストに基づいて埋め込みを学習します。...MNIST Classification
121.1M
621
robot
MSParS (V1.0):知識ベースの質疑応答に用いる多視点意味解析データセット
MSParSはオープンドメインの意味解析タスクに使用される大規模なデータセットです。データセット全体は81,826個のサンプルで構成されており、これらのサンプルは英語を母語とする人々によってアノテーションされています。私たちは...MNIST Classification
4.94M
613
robot
中文繁体字分詞データセット UD-Chinese-GSD
ユニバーサル・依存構造解析(Universal Dependencies)は、複数の言語に対して言語を超えて一貫した木構造データベース(樹庫)のアノテーションを開発することを目的としたプロジェクトであり、その目標は多言語解析器の開発や言語を超えた学習を促進することである...MNIST Classification
400.17M
726
robot
スタンフォード大学Sentiment140感情分析データセット
Sentiment140データセットはスタンフォード大学のクラスプロジェクトで生成された感情分析用のデータセットで、データはtwitterから収集されました。この人気のあるデータセットであなたは完...MNIST Classification
77.6M
1106
robot
多領域感情データセット(2.0版)
マルチドメイン感情データセットには、Amazon.comの多くの商品タイプ(ドメイン)の商品レビューが含まれています。一部のドメイン(書籍やDVD)には数十万件のレビューがあります。他のドメイン(楽器)にはわずか...MNIST Classification
1.53G
683
robot
SMSスパムメール収集データセット、スパムメールまたは合法的なSMSの集合
SMS Spam Corpus v.0.1は、SMSスパム研究のために収集された一連のSMSテキストメッセージのラベル付きデータです。これには、1084と1319のメッセージを含む2つの英語の短いメッセージセットが含まれており、ラベル付けされています。...MNIST Classification
503K
1194
robot
TED平行コーパス
TED平行コーパスは多言語平行コーパスで、多言語並列コーパスと単語コーパスを含みます。TED会議のウェブサイトwww.ted.comから世界の109種類の言語を抽出します。多言語の平行...MNIST Classification
872.9M
972
robot
オイラー図学習オープンソースデータセット
本データセットは、2018年10月23日に多カテゴリでダウンサンプリングして得られたユーザーのクリック行動データに基づいて、グラフデータを構築したものです。注:列区切り文字は「||」。ノード番号:グラフデータは2...MNIST Classification
243.41M
557
robot
騰訊AI Labが大規模で高品質な中国語単語ベクトルデータをオープンソース化
騰訊AI Labが今回公開した中国語単語ベクトルデータには800万以上の中国語語彙が含まれており、その中の各単語は200次元のベクトルに対応しています。既存の中国語単語ベクトルデータと比べて、騰訊AI L...NLP,MNIST Classification
39.4G
700
robot
キュレーションコーパス:キュレーション語彙データベース
キュレーションコーパスには、専門家が執筆した4万編のニュース記事の要約が集められており、記事自体のリンクも付けられています。このリポジトリは、それらにアクセスするためのクローリングツールを提供しています。もしあなたが...NLP Text
123.13M
479
Henry Dashwood
電子メールスパムメール
文脈:[スパムアサシン][1]からのいくつかのメールを使用して、スパムメールとハム(非スパム)メールを区別できるモデルを作成する...NLP,Classification,Software,Email and Messaging Classification
12.08M
291
Wessel van Lit
ACL論文集選集、論文データはACL選集から取得
ACLアンソロジーからの採択論文のデータ。論文の要約がarXivに存在する場合は、そこから抽出されます。データi...NLP,Education,Literature Classification
1.14M
295
Takahiro Kubo
数千の愛に関する質問。このデータセットにはQAサービスからの愛に関する質問と回答が含まれています
コンテキストロシア語このデータセットは、mail.ruサービスの質問に対する実際の回答から収集されたものです:https://otvet.mail....NLP,Education,Text Data,Languages Classification
176.23M
289
Boris Zubarev
クリスマスのレシピ
Religion and Belief Systems,NLP,Cooking and Recipes,Holidays and Cultural Events Classification
2.51M
588
Gary Broughton