有毒な埋め込み物、パズルの有毒コメントチャレンジにおける汎用的な文章符号化テキスト
誰もが同じテキストをUniversal Sentence Embeddingでエンコードする必要はありません。このデータセットには...NLP,Deep Learning,Earth and Nature Classification
610.81M
718
Liling Tan
文章中の感情、文の中で主な感情を表す文章データ
私は多クラス分類を行うために適切にラベル付けされたデータセットを探していました。私は単に…以上のことをしたいと思っていました。...NLP,Earth and Nature,Text Data,Multiclass Classification Classification
2.15M
315
Ishant
COVID 19オープンリサーチデータセットの文章クラスタリング
Coronavirus,NLP,Drugs and Medications,Clustering Classification
258.38M
589
Rajasankar Viswanathan
ウィキペディアの文章、英語版ウィキペディアのダンプから780万の文章が収集されています
ウィキペディアのダンプは巨大なXMLファイルで、あまり有用ではない内容が大量に含まれています。私は何かのためにいくつかの英語のテキストが必要でした...NLP,Text Mining Classification
891.28M
379
Mike Ortman