Select Language

Open Dataset

アラビア語ULMFiTモデル、Ar Wikipediaコーパスに基づくアラビア語モデル アラビア語は世界の主要言語であるにもかかわらず、インターネット上では十分に表現されておらず、アラビア語のリソースが不足しています...NLP,Transfer Learning,Languages Classification
160.13M 650
ケグルの仕事 Computer Science,Education,NLP,Recommender Systems,Search Engines Classification
0.27M 297
0.16M 316
Allennlpパッケージ Computer Science,NLP Classification
715.44M 353
偽ニュース分類 News,NLP Classification
142.92M 615
ConceptNet Numberbatchベクトル、ConceptNetからの単語ベクトル これらはコンセプトネット(ConceptNet)プロジェクトによって公開された単語ベクトルです。コンセプトネット(ConceptNet)の本質は三元組です。...NLP Classification
899.91M 352
注釈付きGMBコーパス、GMBテキストコーパスの注釈サブセット GMB(グロニンゲン意味銀行)コーパスを使用した注釈付きコーパスの固有表現認識(英語でのエンティティ分類用)...NLP,Exploratory Data Analysis,Classification,Random Forest Classification
1.52M 349
『シンプソンズ』のセリフ Arts and Entertainment,NLP,Text Data,Text Mining,Comics and Animation Classification
8.94M 552
ウィキペディアの文章、英語版ウィキペディアのダンプから780万の文章が収集されています ウィキペディアのダンプは巨大なXMLファイルで、あまり有用ではない内容が大量に含まれています。私は何かのためにいくつかの英語のテキストが必要でした...NLP,Text Mining Classification
891.28M 379
Redditコメントのスコア予測、NLPを使用してコメントのスコアを予測 このデータセットの背後にあるアイデアは、特定のコメントが高いアップボティングを受けるかダウンボティングを受けるかを予測しようとすることです。ただし、原文が途中で切れているため、文脈が不十分です。...NLP,Computer Science,Social Science Classification
1.8G 310
SMILES OCRデータセットは、90万を超えるSMILES形式の単一製品反応を含んでいます。 SMILES(簡易分子入力行入力システム)は、分子や反応を入力および表現するための行記号(印刷可能な文字を使用する印刷方法の一種)です。このデータセットには、超過...NLP,Chemistry Classification
175M 820
代名詞解析データセットを確定する コンテキストこちらは、ラーマンとウンが寄贈した明確な代名詞解決データセットのcsvデータセットです。(2012年) http://ww...NLP Classification
143K 337
スタンフォードGloVe 200dデータセットをword2vec形式のデータに変換する スタンフォードのGloVe 200dデータセットはword2vec形式に変換されていますか...NLP,Computer Science Classification
661.31M 682
Warframe Steam スターフレームユーザーレビューデータ このデータはSTEAMからクロールされたもので、2019年4月22日までのデータです。...NLP,Video Games Classification
20.22M 326
SMS スパム 正常メール 予測 Business,Earth and Nature,Internet,Economics,NLP Classification
0.48M 278
英語、フランス語 NLP,Text Data,Languages Classification
18.33M 348
NLP用のテキストデータセット これは自然言語処理(NLP)研究に使用するための3つのテキストデータセットのバンドルです。対話システム技術チャレンジ7(DSTC7)ウブントゥA...NLP,Earth and Nature,Education Classification
6.49G 725
タップタップのレビュー Games,Video Games,NLP,Deep Learning Classification
3.6M 275
FastText:単語埋め込みとテキスト分類を学習するためのライブラリ fastTextはFacebookのAI研究部門(FAI)によって作成された、単語埋め込み学習とテキスト分類のためのライブラリです。...NLP,Computer Science Classification
6.6G 728
バートは一学年下 Arts and Entertainment,NLP Classification
837.78M 583