Select Language

Open Dataset

第三眼データ:テレビニュースアーカイブ Arts and Entertainment,Health,News,NLP Classification
214.53M 203
悪いコメント分類データ # データセットこのデータセットはAshish Guptaによって作成されました。# 内容これには以下のファイルが含まれています。...Clothing and Accessories,Exercise Classification
86.11M 374
フリードリヒ・ニーチェの本 NLP,Literature,Linguistics,Philosophy Classification
1.7M 237
ハースストーン ハースストーンのカード名と説明の翻訳データ ハースストーンのカード名と説明の翻訳。言語:ドイツ語、英語、スペイン語、フランス語、イタリア語、日本語、K...NLP,Arts and Entertainment,Video Games,Games,Comics and Animation,Card Games Classification
54.7M 561
中等文章タイトル Arts and Entertainment,Computer Science,NLP Classification
0.01M 225
中国文字20950、UTF - 8におけるすべての漢字とその発音のデータセット 中国文字20950、UTF - 8におけるすべての漢字とその発音のデータセット...NLP,Comics and Animation Classification
1.2M 399
グーグルのWord2Vecモデル、300万個の単語とフレーズを含む語彙の単語ベクトル 1.5GBです!これには、約100bで学習させた、300万語の単語とフレーズの語彙に対する単語ベクトルが含まれています。...Computer Science,Programming Classification
3.64G 412
ウィキペディア記事データセット ウィキペディアフランス語版2008年のウィキペディアダンプ...NLP Classification
2.12G 347
情緒関連テキストデータセット 情緒関連テキストデータセット...Movies and TV Shows Classification
11.3M 423
MNISTに類似したアルファベットのデータセット(A - Z) 28x28の手書きアルファベット画像から構成されています。内容:合計785列があり、各行はアルファベットの画像で構成されています。Th...NLP,MNIST,CNN Classification
665.89M 762
ハバーモデル、各業界のテキストデータ ハバーモデル、各業界のテキストデータ...NLP,MNIST Classification
473.41M 422
偏差のあるデータセットの毒性クリーン版 バイアスデータセットを用いた毒性のクリーンアップ版、バイアスを除去した毒性...NLP,Data Cleaning,Health Classification
535.39M 743
ロシアのテレグラムチャット記録、ロシアのテレグラムチャットで解析されたデータを公開 最も人気のあるロシアの公開Telegramチャットから解析されたロシアのTelegramチャット履歴データ...NLP,Text Data,Russia Classification
11.08G 386
自然言語処理における感情分析 #データセット このデータセットはNowYSMによってDatabase:Open Database,Contents:Database Contents#Contentsの下で作成されました。これには以下のファイルが含まれています。...NLP,Arts and Entertainment Classification
2.52M 389
手書き数学記号データセット、10万以上の画像サンプル データセットはjpgファイル(45x45)から構成されています。免責事項:データセットには全くヘブライ語のアルファベットは含まれていません。基本的なギリシャ語を含んでいます。...NLP,Computer Science,Law,Email and Messaging Classification
410.19M 628
NLPデータ # データセットこのデータセットはAbiyuGによって作成されました。CC BY - NC - SA 4.0の下で公開されています。# 内容これには以下のファイルが含まれています。...NLP,Psychology Classification
3.14M 369
ロボット様に登場する単語イベント、F-Societyが好きな流行語を知る 「Mr. Robot」は、データを破壊すること、暗号化すること、削除することなど、すべてデータに関するものです。私はいくつかのデータを掘り起こしたいと思いました。...Arts and Entertainment,Games Classification
0.31M 424
スタートレックの脚本、すべての《スタートレック》シリーズの脚本のオリジナルテキスト脚本と処理行 スター・トレックの脚本テキストデータは、http://www.chakoteya.net/StarTrek/index.html のデータからスクレイピングされました。コードはこちら:https://github。...NLP,Movies and TV Shows,Text Data,Text Mining Classification
42.63M 371
中国機械翻訳研究会、コーパスデータセット # データセットこのデータセットはTan Lilingによって作成されました。その他(説明で指定)の下で公開されました。# 内容これには...Deep Learning,Computer Science Classification
6.6G 498