Select Language

Open Dataset

3454.67M 209
10484.2M 224
トゥリアン埋め込み Computer Science,Programming,NLP Classification
1246.83M 211
4872.67M 234
野菜 (グーグルWord2vec自由ライブラリ、.tsvファイル) 野菜 (Google Word2Vec Freebase、.tsvファイル)...NLP,Computer Science,Food Classification
20G 741
性別推測のツイートファイル Online Communities,Social Science,Social Networks,NLP,Binary Classification,Gender Classification
5.74M 531
DARPA TIMIT音響音声連続音声 #DARPA TIMIT音響音声連続音声コーパス-**特に感謝**:**https://github.com/philipperemy/timit/edit/master/README.md**-**ダウンロード**...NLP,Audio Data Classification
1198.1M 275
野菜(セナ埋め込み) Unsplash上の[NeONBRAND][1]の謝辞バナーとロゴの写真...NLP,Earth and Nature,Computer Science Classification
129M 215
第三眼データ:テレビニュースアーカイブ Arts and Entertainment,Health,News,NLP Classification
214.53M 203
フリードリヒ・ニーチェの本 NLP,Literature,Linguistics,Philosophy Classification
1.7M 236
ハースストーン ハースストーンのカード名と説明の翻訳データ ハースストーンのカード名と説明の翻訳。言語:ドイツ語、英語、スペイン語、フランス語、イタリア語、日本語、K...NLP,Arts and Entertainment,Video Games,Games,Comics and Animation,Card Games Classification
54.7M 560
中等文章タイトル Arts and Entertainment,Computer Science,NLP Classification
0.01M 222
ウィキペディア記事データセット ウィキペディアフランス語版2008年のウィキペディアダンプ...NLP Classification
2.12G 343
偏差のあるデータセットの毒性クリーン版 バイアスデータセットを用いた毒性のクリーンアップ版、バイアスを除去した毒性...NLP,Data Cleaning,Health Classification
535.39M 742
ロシアのテレグラムチャット記録、ロシアのテレグラムチャットで解析されたデータを公開 最も人気のあるロシアの公開Telegramチャットから解析されたロシアのTelegramチャット履歴データ...NLP,Text Data,Russia Classification
11.08G 385
自然言語処理における感情分析 #データセット このデータセットはNowYSMによってDatabase:Open Database,Contents:Database Contents#Contentsの下で作成されました。これには以下のファイルが含まれています。...NLP,Arts and Entertainment Classification
2.52M 388
NLPデータ # データセットこのデータセットはAbiyuGによって作成されました。CC BY - NC - SA 4.0の下で公開されています。# 内容これには以下のファイルが含まれています。...NLP,Psychology Classification
3.14M 368
スタートレックの脚本、すべての《スタートレック》シリーズの脚本のオリジナルテキスト脚本と処理行 スター・トレックの脚本テキストデータは、http://www.chakoteya.net/StarTrek/index.html のデータからスクレイピングされました。コードはこちら:https://github。...NLP,Movies and TV Shows,Text Data,Text Mining Classification
42.63M 362
有毒な埋め込み物、パズルの有毒コメントチャレンジにおける汎用的な文章符号化テキスト 誰もが同じテキストをUniversal Sentence Embeddingでエンコードする必要はありません。このデータセットには...NLP,Deep Learning,Earth and Nature Classification
610.81M 718