Open Dataset
Data Structure ?
72.61M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
これは、アリゾナ州立大学(ASU)における偽ニュース研究のための進行中のデータ収集プロジェクトのリポジトリです。我々は、「Fake News Detection on Social Media: A Data Mining Perspective」において、FakeNewsNetを他の既存のデータセットと比較して説明しています。また、「Exploiting Tri-Relationship for Fake News Detection」において、FakeNewsNetデータセットの詳細な分析を行い、このデータセットを用いて偽ニュース検出モデルを構築しています。
このデータセットのJSONバージョンは、ここのGitHubで入手できます。
FakeNewNetで説明されているこのデータセットの新しいバージョンは近日公開されます。または、詳細情報については著者にメールで問い合わせることができます。
ニュース内容
これには、以下のようなニュース内容属性を持つすべての偽ニュース記事が含まれています。
出所:ニュース記事の著者または発行者を示します。
見出し:読者の注意を引くことを目的とし、ニューストピックの主要部分に関連する短いテキストを指します。
本文:ニュースの詳細を説明します。通常、発行者の視点を形成する主要な主張があり、それが特に強調され、詳述されます。
画像・動画:ニュース記事の本文の重要な部分であり、物語を構成する視覚的手がかりを提供します。
社会的文脈
これには、Twitterからの偽ニュース記事の社会的関与が含まれています。我々は、すべての関連ユーザーのプロフィール、投稿、およびソーシャルネットワーク情報を抽出しています。
ユーザープロフィール:ユーザーの基本情報を記述する一連のプロフィールフィールドが含まれています。
ユーザー投稿内容:ユーザーのTwitterでの最近の投稿を収集します。
ユーザーのフォロワー:関連ユーザーのフォロワーリストが含まれています。
ユーザーのフォロー先:関連ユーザーがフォローしているユーザーのリストが含まれています。
参考文献
このデータセットを使用する場合は、以下の論文を引用してください。
@article{shu2017fake,
title={Fake News Detection on Social Media: A Data Mining Perspective},
author={Shu, Kai and Sliva, Amy and Wang, Suhang and Tang, Jiliang and Liu, Huan},
journal={ACM SIGKDD Explorations Newsletter},
volume={19},
number={1},
pages={22--36},
year={2017},
publisher={ACM}
}
@article{shu2017exploiting,
title={Exploiting Tri-Relationship for Fake News Detection},
author={Shu, Kai and Wang, Suhang and Liu, Huan},
journal={arXiv preprint arXiv:1712.07709},
year={2017}
}
@article{shu2018fakenewsnet,
title={FakeNewsNet: A Data Repository with News Content, Social
Context and Dynamic Information for Studying Fake News on Social Media},
author={Shu, Kai and Mahudeswaran, Deepak and Wang, Suhang and Lee,
Dongwon and Liu, Huan},
journal={arXiv preprint arXiv:1809.01286},
year={2018}
}
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
- Share your thoughts
ALL
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.