有毒な埋め込み物、パズルの有毒コメントチャレンジにおける汎用的な文章符号化テキスト
誰もが同じテキストをUniversal Sentence Embeddingでエンコードする必要はありません。このデータセットには...NLP,Deep Learning,Earth and Nature Classification
610.81M
718
Liling Tan
ロシア語の有毒コメント、2chマーク注釈付きの小規模データセット
# データセットこのデータセットはアナトリー・ベリチコフによって作成されました。GPL 2の下で公開されています。# 内容これには次のものが含まれています...NLP,Text Data,Binary Classification Classification
4.45M
465
АнатолийБельчиков
有毒コメント検出多言語[拡張]、Jigsaw有毒通信ネットワーク分類コンテストの補足
これは、世の中にあるすべての有害コメントデータベースの集大成です。私はこれを、ジグソー有害(コメント分類)の際に使いやすくするために作成しました。...NLP,Deep Learning,Classification,Binary Classification Classification
117.55M
296
Alan Sun
ジグソー有毒コメント分類クリーニングデータ、ジグソーコメント、感情付き、コメントの長さと翻訳テキスト
私はジグソー多言語有害コメント分類コンペティションに取り組んでいて、データが必要であることを発見しました...NLP,Deep Learning,Feature Engineering,Text Data Classification
263.44M
390
Sleeba Paul