Related data classification
9
534
2
5
9
11
15
2
2
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
アラビア語ULMFiTモデル、Ar Wikipediaコーパスに基づくアラビア語モデル
アラビア語は世界の主要言語であるにもかかわらず、インターネット上では十分に表現されておらず、アラビア語のリソースが不足しています...NLP,Transfer Learning,Languages Classification
160.13M
650
Abed Khooli
ケグルの仕事
Computer Science,Education,NLP,Recommender Systems,Search Engines Classification
0.27M
297
AbdullahAli
ConceptNet Numberbatchベクトル、ConceptNetからの単語ベクトル
これらはコンセプトネット(ConceptNet)プロジェクトによって公開された単語ベクトルです。コンセプトネット(ConceptNet)の本質は三元組です。...NLP Classification
899.91M
352
Nohman
注釈付きGMBコーパス、GMBテキストコーパスの注釈サブセット
GMB(グロニンゲン意味銀行)コーパスを使用した注釈付きコーパスの固有表現認識(英語でのエンティティ分類用)...NLP,Exploratory Data Analysis,Classification,Random Forest Classification
1.52M
349
Shoumik
『シンプソンズ』のセリフ
Arts and Entertainment,NLP,Text Data,Text Mining,Comics and Animation Classification
8.94M
552
Pierre Megret
ウィキペディアの文章、英語版ウィキペディアのダンプから780万の文章が収集されています
ウィキペディアのダンプは巨大なXMLファイルで、あまり有用ではない内容が大量に含まれています。私は何かのためにいくつかの英語のテキストが必要でした...NLP,Text Mining Classification
891.28M
379
Mike Ortman
Redditコメントのスコア予測、NLPを使用してコメントのスコアを予測
このデータセットの背後にあるアイデアは、特定のコメントが高いアップボティングを受けるかダウンボティングを受けるかを予測しようとすることです。ただし、原文が途中で切れているため、文脈が不十分です。...NLP,Computer Science,Social Science Classification
1.8G
310
Evan Hallmark
SMILES OCRデータセットは、90万を超えるSMILES形式の単一製品反応を含んでいます。
SMILES(簡易分子入力行入力システム)は、分子や反応を入力および表現するための行記号(印刷可能な文字を使用する印刷方法の一種)です。このデータセットには、超過...NLP,Chemistry Classification
175M
820
Elahi
代名詞解析データセットを確定する
コンテキストこちらは、ラーマンとウンが寄贈した明確な代名詞解決データセットのcsvデータセットです。(2012年) http://ww...NLP Classification
143K
337
Ariba Siddiqui
スタンフォードGloVe 200dデータセットをword2vec形式のデータに変換する
スタンフォードのGloVe 200dデータセットはword2vec形式に変換されていますか...NLP,Computer Science Classification
661.31M
682
the kwisatz haderach
Warframe Steam スターフレームユーザーレビューデータ
このデータはSTEAMからクロールされたもので、2019年4月22日までのデータです。...NLP,Video Games Classification
20.22M
326
Jiaxu Zhang
NLP用のテキストデータセット
これは自然言語処理(NLP)研究に使用するための3つのテキストデータセットのバンドルです。対話システム技術チャレンジ7(DSTC7)ウブントゥA...NLP,Earth and Nature,Education Classification
6.49G
725
Florian Peters
FastText:単語埋め込みとテキスト分類を学習するためのライブラリ
fastTextはFacebookのAI研究部門(FAI)によって作成された、単語埋め込み学習とテキスト分類のためのライブラリです。...NLP,Computer Science Classification
6.6G
728
Jia Yang