返回主站|会员中心|保存桌面 手机浏览
以橱窗方式浏览 | 以目录方式浏览 Dataset
图片 标 题 更新时间
パズル競技データセット、英語に翻訳されたテキストを含む
これらのデータセットは[ジグソーコンペティション](https://www.kaggle.com/c/jigsaw-multilingual-toxic-comment-classification)を指します
2023-03-16
BERT英語の無冠詞・二重冠詞、BERT英語の上限なし訓練データの二重スペクトログラム周波数
BERTはあなたのデータをファインチューニングするのに適したモデルでしょうか?それとも最初から事前学習する必要がありますか?あなたのモデルのトレーニングを知って
2023-03-16
名称エンティティ認識データセット
人間のアノテーターによるラベルアノテーションの誤りは、固有表現抽出(NER)に2つの課題をもたらします。テストセットの誤りは干渉する可能性があります。
2023-03-16
28種類の言語における停止語、自然言語処理におけるテキスト前処理
ストップワードは、どの言語においても文に大きな意味を追加しない単語です。それらは安全に無視することができます
2023-03-16
電子メールテキスト分類
あなたが仕事をしているなら、受信トレイに乱雑に並んでいるすべてのメールを読むという問題に直面することは避けられません。
2023-03-16
COVID 19インドネシアのツイート、「新型コロナ肺炎」と「政府」に関連するインドネシアのツイート
このデータセットには、「Corona」および「Pemerintah o」というキーワードを使用したインドネシア語のツイートが含まれています。
2023-03-16
ヴィルグール(Virgool)データセット、これはvirgool.ioから収集されたペルシャ語の記事データのセットです
これはペルシャ語の作家やブロガーにとって、提案されたハッシュタグやさらにはトピックを自動的に選ぶための便利なツールになるかもしれません。
2023-03-16
言語ラベル付きのテキストデータ。言語検出に使用できます。
言語検出データセット 言語ラベル付きのテキストデータ。言語検出に使用できます。
2023-03-16