Select Language

Open Dataset

TREC2005 - 2007スパムメールデータセット

TREC2005 - 2007スパムメールデータセット

1.6G
832 hits
1 likes
1 downloads
0 discuss
NLP,International Relations Classification,Text

TREC 2006 Spam Track Public Corpora:https://plg.uwaterloo.ca/~gvcormac/treccorpus06/about.htmlは公開されたスパムメールコーパスです。......

Data Structure ? 1.6G

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    TREC 2006 Spam Track Public Corpora:https://plg.uwaterloo.ca/~gvcormac/treccorpus06/about.html

    これは公開されたスパムメールコーパスで、国際テキスト検索会議によって提供されています。英語データセット(trec06p)と中国語データセット(trec06c)に分けられ、そこに含まれるメールはすべて実際のメールに由来し、メールの元の形式と内容が保持されています。

    TREC 2006のほかに、TREC 2005とTREC 2007の英語スパムメールデータセットもあります(中国語版はありません)。

    ファイルディレクトリの形式:delayとfullはそれぞれ一種のスパムメールフィルターのフィルタリングメカニズムです。fullディレクトリの下には、理想的なメール分類結果があり、これを研究のラベルと見なすことができます。

    ```
    trec06c

    └───data
    │   │   000
    │   │   001
    │   │   ...
    │   └───215
    └───delay
    │   │   index
    └───full
    │   │   index 


    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:15 Go earn points?
    • 832
    • 1
    • 1
    • collect
    • Share