セス・ゴーディンのブログデータセット
Business,Internet,Online Communities,NLP,Literature,Text Data,Text Mining,Marketing Classification
16.49M
301
Roman Glushko
94.28M
634
Rough Rider 404
WikiText長期依存性言語モデリングデータセット
WikiText言語モデリングデータセットは、ウィキペディア上の検証済みの良質な記事と特集記事のセットから抽出された1億個以上のトークンの集合です。ペンシルベニアツリーバンク(PTB)との...NLP,Deep Learning,Text Data Classification
1.11G
278
Rohit Gupta
古典英語文学コーパスとメタデータ、古典英語書籍とその著者
これは英語の古典読物に関するデータセットで、一部のケースでは他の言語が英語に翻訳されています。ディケンズ、プラトン、シャ...NLP,Arts and Entertainment,Literature Classification
431.55M
340
Raynard Jon
100万部を提出する
Internet,Online Communities,Social Networks,NLP,Popular Culture Classification
700.01M
271
Vishal Singh
ジャナタハク:独立記念日
Earth and Nature,Internet,Education,Sports,NLP,Beginner Classification
451.85M
288
Anmol Kumar
インドネシアの名前
Earth and Nature,Education,NLP,Deep Learning,Text Data,People,Gender Classification
0.03M
260
Dionisius Darryl Hermansyah
ニューラルリンクのツイート
Business,Online Communities,News,NLP,Artificial Intelligence Classification
1.08M
267
Abhishek