Select Language

Open Dataset

WikiText英語語彙データベース 1億個の語彙を含む英語語彙データベースのデータ WikiText英語語彙データ(TheWikiTextLongTermDependencyLanguageModelingDataset)WikiText長期依存言語モデリングデータセットは1億を含む...NLP Text
373.28M 1207
JRC Names 固有専有名詞データベース JRC-Namesは、個人および組織名(「エンティティ」と呼ばれる)に使用される高度に多言語の命名エンティティリソースです。それは大量の名前リストとその複数の綴りバリエーションを含んでいます(単一の人...NLP Text
762.56M 1614
PubMed医学データセット:抽出された3984個の医学文が含まれています このデータセットには、PubMedの要約から抽出された3984個の医学文が含まれており、異なる医学用語間の関係が注釈付けされています。このデータセットは主に「治療」と「病因」の関係に焦点を当てています。...NLP Classification
9.4M 1140
英文単語識別画像データセット Text Recognitionは文字認識用の画像データで、900万枚の画像が含まれ、画像中には9万個以上の英単語があり、光学文字認識タスク(Optic)に使用できます。...Image Search Classification
9.41G 687
単語と物体を処理する際のfMRI画像データ OpenfMRIデータベース(Poldrackら、2013年;PoldrackとGorgolewski、2015年)は、MRIとEEG技術を用いて収集された脳画像データベースです。それは201...Image Search Classification
3.14G 779
FastText:単語埋め込みとテキスト分類を学習するためのライブラリ fastTextはFacebookのAI研究部門(FAI)によって作成された、単語埋め込み学習とテキスト分類のためのライブラリです。...NLP,Computer Science Classification
6.6G 728
グーグルのWord2Vecモデル、300万個の単語とフレーズを含む語彙の単語ベクトル 1.5GBです!これには、約100bで学習させた、300万語の単語とフレーズの語彙に対する単語ベクトルが含まれています。...Computer Science,Programming Classification
3.64G 410
ハバーモデル、各業界のテキストデータ ハバーモデル、各業界のテキストデータ...NLP,MNIST Classification
473.41M 422
英語の単語頻度、⅓百万のインターネット上で最も一般的な英語の単語 このデータセットには、英語のウェブ上で最も一般的に使用される333,333個の単語の出現回数が含まれており、これは...Languages Classification
4.73M 707
fastText事前学習単語ベクトルデータセット fastText事前学習済み単語ベクトル 英語...Others Classification
8.49G 545
事前学習済みのword2vecモデル、英語版ウィキペディアデータ # データセットこのデータセットはRabidBearによって作成されました。# 内容これには以下のファイルが含まれています。...Others Classification
3.2G 475