Related data classification
9
534
2
5
9
11
15
2
2
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
WikiText英語語彙データベース 1億個の語彙を含む英語語彙データベースのデータ
WikiText英語語彙データ(TheWikiTextLongTermDependencyLanguageModelingDataset)WikiText長期依存言語モデリングデータセットは1億を含む...NLP Text
373.28M
1207
Stephen Merity
JRC Names 固有専有名詞データベース
JRC-Namesは、個人および組織名(「エンティティ」と呼ばれる)に使用される高度に多言語の命名エンティティリソースです。それは大量の名前リストとその複数の綴りバリエーションを含んでいます(単一の人...NLP Text
762.56M
1614
欧盟科学中心
PubMed医学データセット:抽出された3984個の医学文が含まれています
このデータセットには、PubMedの要約から抽出された3984個の医学文が含まれており、異なる医学用語間の関係が注釈付けされています。このデータセットは主に「治療」と「病因」の関係に焦点を当てています。...NLP Classification
9.4M
1140
appen
英文単語識別画像データセット
Text Recognitionは文字認識用の画像データで、900万枚の画像が含まれ、画像中には9万個以上の英単語があり、光学文字認識タスク(Optic)に使用できます。...Image Search Classification
9.41G
687
robot
単語と物体を処理する際のfMRI画像データ
OpenfMRIデータベース(Poldrackら、2013年;PoldrackとGorgolewski、2015年)は、MRIとEEG技術を用いて収集された脳画像データベースです。それは201...Image Search Classification
3.14G
779
robot
FastText:単語埋め込みとテキスト分類を学習するためのライブラリ
fastTextはFacebookのAI研究部門(FAI)によって作成された、単語埋め込み学習とテキスト分類のためのライブラリです。...NLP,Computer Science Classification
6.6G
728
Jia Yang
グーグルのWord2Vecモデル、300万個の単語とフレーズを含む語彙の単語ベクトル
1.5GBです!これには、約100bで学習させた、300万語の単語とフレーズの語彙に対する単語ベクトルが含まれています。...Computer Science,Programming Classification
3.64G
410
Umberto
英語の単語頻度、⅓百万のインターネット上で最も一般的な英語の単語
このデータセットには、英語のウェブ上で最も一般的に使用される333,333個の単語の出現回数が含まれており、これは...Languages Classification
4.73M
707
Rachael Tatman
事前学習済みのword2vecモデル、英語版ウィキペディアデータ
# データセットこのデータセットはRabidBearによって作成されました。# 内容これには以下のファイルが含まれています。...Others Classification
3.2G
475
RabidBear