返回主站|会员中心|保存桌面 手机浏览
以橱窗方式浏览 | 以目录方式浏览 Dataset
图片 标 题 更新时间
ペルシャ語ウィキペディアデータセット、ペルシャ語(ペルシャ語)ウィキペディアコーパス
ペルシャ語(ファルシ語)ウィキペディアデータセット | すべてのファルシ語記事を含むファルシ語ウィキペディアデータセット
2023-03-16
WikiText長期依存性言語モデリングデータセット
WikiText言語モデリングデータセットは、ウィキペディア上の検証済みの良質な記事と特集記事のセットから抽出された1億個以上のトークンの集合です。ペンシルベニアツリーバンク(PTB)との
2023-03-16
古典英語文学コーパスとメタデータ、古典英語書籍とその著者
これは英語の古典読物に関するデータセットで、一部のケースでは他の言語が英語に翻訳されています。ディケンズ、プラトン、シャ
2023-03-16
CORD - 19完全インデックス、完全なCORD - 19データセット上で埋め込みインデックス
完全なCORD - 19データセットに対する文埋め込みインデックス。コロナに関するCOVID - 19と非COVID - 19のタグ付き文献の両方を含む
2023-03-16
RedditインドNLPデータセット、データセットには2017年から2020年までのR/Indiaサブフォーラムの投稿が含まれています
[![forthebadge made-with-python](http://ForTheBadge.com/images/badges/made-with-python.svg)](https://www.python.org/) [!"
2023-03-16
arxivデータセット、過去18か月間のアーカイブデータセット
アーキブデータセット 過去18か月間のアーキブデータセット
2023-03-16
ジグソー有毒コメント分類クリーニングデータ、ジグソーコメント、感情付き、コメントの長さと翻訳テキスト
私はジグソー多言語有害コメント分類コンペティションに取り組んでいて、データが必要であることを発見しました
2023-03-16
OSCARネパール語コーパス、ネパール語テキストコーパス、NLPの教師なし言語モデルの訓練に使用
これらのファイルは[OSCARコーパス](https://oscar-corpus.com/)からのものです。詳細な情報については、彼らのサイトを訪問してください。このデータセットは
2023-03-16