返回主站|会员中心|保存桌面 手机浏览
以橱窗方式浏览 | 以目录方式浏览 Dataset
图片 标 题 更新时间
Tanglish感情分析ツイートでは、ツイートの感情を表すために4つのラベルを使用しています
それはすべて、私があるプロジェクトに使うためにローマ字表記の虐待的なタミル語のツイートを探していたときに始まりました。そして、代わりに
2023-03-16
COVID-19関連のよくある質問。このデータは新型コロナウイルス肺炎関連のQ&Aセット19を含んでいます。
これは何ですか?このデータには、COVID - 19に関連する質問と回答のコレクションが含まれています。これはどこから来たのですか?これ
2023-03-16
テストケースデータセット、ソフトウェアテストで使用されるサンプルデータセットの集合
NLPやコンピュータビジョンなど、さまざまな機械学習タスクに利用可能な多数のデータセットがあります。しかし、私は
2023-03-16
純テキストのウィキペディア。各ファイルにはウィキペディアの記事の集合が含まれています。
ウィキペディアのダンプには大量のマークアップが含まれています。ウィキメディアテキストはマークダウンとHTMLのハイブリッドであり、非常に…
2023-03-16
201のStackexchangeサイトからのタグ集合
このデータは、StackExchangeからUmbrella配下の200以上のウェブサイトから抽出されたものです。このデータにはあらゆる可能性が含まれています
2023-03-16
野菜 (グーグルWord2vec自由ライブラリ、.tsvファイル)
野菜 (Google Word2Vec Freebase、.tsvファイル)
2023-03-15
インドニュースデータセットは、「インディアン・タイムズ」が発表した約360万件のイベントを含んでいます。
このニュースデータセットは、2001年初から第1四半期までのインド亜大陸における注目すべき出来事の永続的な歴史アーカイブです
2023-03-15
百万篇ドイツのニュース記事データセット、10kGNADは百万篇の記事コーパスに基づいています。
10kGNADデータセットは、最初のドイツ語の主題分類データセットとして、一部の問題を解決することを目的としています。これはオーストリアのオンライン新聞社の10273編のドイツ語のニュース記事から構成されており、9つの主題に分けられています
2023-03-15