Select Language

Open Dataset

スパムメールまたは非スパムメールデータセット

スパムメールまたは非スパムメールデータセット

4.06M
270 hits
0 likes
1 downloads
0 discuss
Email and Messaging,Binary Classification Classification

Data Structure ? 4.06M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    コンテキスト このコレクションは、https://spamassassin.apache.org/old/publiccorpus/ (すなわち、 _Apache SpamAssassinの公開データセット_ )から取得した '0030228_easy_ham.tar.bz2' と '20030228_spam.tar.bz2' で構成されています。このデータセットには、2500通の正常メール(ハム)と500通のスパムメールが含まれています。また、すべての数字とURLはそれぞれ `NUMBER` と `URL` という文字列に変換されていることにも気づくでしょう。これは簡略化されたスパムと正常メールのデータセットです。 謝辞 この内容についての最初の接触は、「Scikit - LearnとTensorFlowを使ったPythonによる機械学習とディープラーニング」という本でした。もしあなたが第3章の最後の質問に従うと、オレリアン・ジェロンはあなたにこのデータセットを使ってスパム分類器を構築するように求めています。オレリアンに感謝して、私はデータ自体に慣れ、埋め込みや機械学習アルゴリズムを含むいくつかのモデルを試しました。
    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:0 Go earn points?
    • 270
    • 1
    • 0
    • collect
    • Share