Select Language

Open Dataset

redditの250万件の投稿データ

redditの250万件の投稿データ

437.79M
1500 hits
1 likes
2 downloads
0 discuss
NLP Text

アメリカのRedditニュースサイトで最も人気のある2500人の投稿者の、各メディア1000件の投稿内容とコメントのデータセット。購読者からの上位2500件のサブ評価。2013年8月から......

Data Structure ? 437.79M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    アメリカのredditニュースサイトで最も人気のある2500人の投稿者が所属する各メディアの1000件の投稿内容とコメントのデータセット。これは、2013年8月15日から20日までの期間にredditから抽出された、購読者からの上位2500のサブレディットの評価に基づくものです。

    これは何ですか?

    これはredditの人気投稿のデータセットです。上位2500のサブレディットの上位1000の過去の投稿を含み、合計250万件の投稿があります。上位のサブレディットの順位は購読者数によって決定され、リストファイルに記載されています。

    これらのデータは2013年8月15日から20日の間に抽出されました。

    各ファイルはCSV形式で、関連するサブレディット名がファイル名となっています。各CSVファイルにはヘッダー行が含まれています。

    これは何に使えますか?

    簡単な例を挙げると、これはSerendipityで最も投票されたドメインの内訳です。(そう、円グラフです。)

    TF-IDFを使ってサブレディットの重要な用語を見つけることができます。また、意味解析なども行えます。


    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:10 Go earn points?
    • 1500
    • 2
    • 1
    • collect
    • Share