Select Language

Open Dataset

記憶トラッカーを捕捉する

記憶トラッカーを捕捉する

2686.29M
208 hits
0 likes
1 downloads
0 discuss
Business,Earth and Nature,Internet,Literature,Linguistics Classification

Data Structure ? 2686.29M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    このデータベースには、[SNAP](http://snap.stanford.edu/index.html)によって収集された[メメトラッカー](http://snap.stanford.edu/data/memetracker9.html)データセットのサブセットが含まれています。 完全なメメトラッカーデータセットは、観測データが月単位に分割されています。ただし、サイズの制約から、このバージョンは半月分、つまり2008年11月のメメトラッカー観測データの最初の15日分で構成されています。 ## 概要 メメトラッカーは、インターネット上のニュース全体にわたって、時間の経過とともに最も頻繁に出現する引用やフレーズを追跡します。これにより、毎日どのような異なる記事がニュースやブログの報道を争っているか、また特定の記事がどのように持続し、他の記事がどのようにすぐに消えるかを確認することができます。 全体として、メメトラッカーは1700万を超える異なるフレーズを追跡しており、フレーズ/引用の総言及数の約54%がブログに、46%がニュースメディアに現れています。 ## 謝辞 このデータセットはスタンフォードネットワーク分析プロジェクトによって収集されました。データとその分析に関する詳細情報は、[こちら](http://snap.stanford.edu/data/memetracker9.html)のウェブサイトで確認できます。 このデータセットの分析結果は以下の文献で公開されています。 J. Leskovec, L. Backstrom, J. Kleinberg. [Meme - tracking and the Dynamics of the News Cycle](http://cs.stanford.edu/people/jure/pubs/quotes - kdd09.pdf). ACM SIGKDD Intl. Conf. on Knowledge Discovery and Data Mining, 2009. ## データ SQLiteデータベースには3つのテーブルが含まれています。 記事(articles):4,542,920件のレコードがあり、以下のフィールドがあります。 - **記事ID(article_id)**:記事の一意のID(整数) - **URL(url)**:記事のURL(テキスト) - **日付(date)**:記事の日付(テキスト)で、strptime形式 '%Y-%m-%d %H:%M:%S' 引用(quotes):7,956,125件のレコードがあり、以下のフィールドがあります。 - **記事ID(article_id)**:この引用が見つかった記事の一意のID(整数) - **フレーズ(phrase)**:記事内で見つかった高頻度のフレーズ(テキスト) リンク(links):16,727,125件のレコードがあり、以下のフィールドがあります。 - **記事ID(article_id)**:このリンクが見つかった記事の一意のID(整数) - **外部リンクURL(link_out)**:外部リンクのURL(テキスト) - **ターゲット記事ID(link_out_id)**:ターゲット記事の一意のID(整数)。存在しない場合はNULL
    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:0 Go earn points?
    • 208
    • 1
    • 0
    • collect
    • Share