Open Dataset
Data Structure ?
2686.29M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
このデータベースには、[SNAP](http://snap.stanford.edu/index.html)によって収集された[メメトラッカー](http://snap.stanford.edu/data/memetracker9.html)データセットのサブセットが含まれています。
完全なメメトラッカーデータセットは、観測データが月単位に分割されています。ただし、サイズの制約から、このバージョンは半月分、つまり2008年11月のメメトラッカー観測データの最初の15日分で構成されています。
## 概要
メメトラッカーは、インターネット上のニュース全体にわたって、時間の経過とともに最も頻繁に出現する引用やフレーズを追跡します。これにより、毎日どのような異なる記事がニュースやブログの報道を争っているか、また特定の記事がどのように持続し、他の記事がどのようにすぐに消えるかを確認することができます。
全体として、メメトラッカーは1700万を超える異なるフレーズを追跡しており、フレーズ/引用の総言及数の約54%がブログに、46%がニュースメディアに現れています。
## 謝辞
このデータセットはスタンフォードネットワーク分析プロジェクトによって収集されました。データとその分析に関する詳細情報は、[こちら](http://snap.stanford.edu/data/memetracker9.html)のウェブサイトで確認できます。
このデータセットの分析結果は以下の文献で公開されています。
J. Leskovec, L. Backstrom, J. Kleinberg. [Meme - tracking and the Dynamics of the News Cycle](http://cs.stanford.edu/people/jure/pubs/quotes - kdd09.pdf). ACM SIGKDD Intl. Conf. on Knowledge Discovery and Data Mining, 2009.
## データ
SQLiteデータベースには3つのテーブルが含まれています。
記事(articles):4,542,920件のレコードがあり、以下のフィールドがあります。
- **記事ID(article_id)**:記事の一意のID(整数)
- **URL(url)**:記事のURL(テキスト)
- **日付(date)**:記事の日付(テキスト)で、strptime形式 '%Y-%m-%d %H:%M:%S'
引用(quotes):7,956,125件のレコードがあり、以下のフィールドがあります。
- **記事ID(article_id)**:この引用が見つかった記事の一意のID(整数)
- **フレーズ(phrase)**:記事内で見つかった高頻度のフレーズ(テキスト)
リンク(links):16,727,125件のレコードがあり、以下のフィールドがあります。
- **記事ID(article_id)**:このリンクが見つかった記事の一意のID(整数)
- **外部リンクURL(link_out)**:外部リンクのURL(テキスト)
- **ターゲット記事ID(link_out_id)**:ターゲット記事の一意のID(整数)。存在しない場合はNULL
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.