Open Dataset
Data Structure ?
656.04M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
# 300万件のロシアのトロールツイート
このデータは、FiveThirtyEightの記事「[なぜ我々が300万件のロシアのトロールツイートを公開するのか](https://fivethirtyeight.com/features/why-were-sharing-3-million-russian-troll-tweets/)」で使用されました。
このディレクトリには、ロシアの「トロール工場」であり、2018年2月に司法省が特別検察官ロバート・ミューラーのロシア調査の一環として起訴状([https://www.justice.gov/file/1035477/download](https://www.justice.gov/file/1035477/download))を提出した被告であるインターネット調査局に関連するツイッターアカウントから送信された約300万件のツイートに関するデータが含まれています。このデータベース内のツイートは、2012年2月から2018年5月の間に送信されたもので、大部分は2015年から2017年に投稿されたものです。
FiveThirtyEightは、2018年7月25日に、クレムソン大学の研究者であるコミュニケーション学の准教授[ダレン・リンヴィル](https://www.clemson.edu/cbshs/faculty-staff/profiles/darrenl)と経済学の准教授[パトリック・ウォーレン](http://pwarren.people.clemson.edu/)からこのデータを入手しました。彼らは、Salesforceが所有し、クレムソン大学の[ソーシャルメディアリスニングセンター](https://www.clemson.edu/cbshs/centers-institutes/smlc/)が契約で使用しているSocial Studioというツールを使ったカスタム検索でデータを収集しました。
このデータに含まれるツイッターアカウントの基礎となるのは、ツイッターが議会に[提供](https://democrats-intelligence.house.gov/news/documentsingle.aspx?DocumentID=396)した、インターネット調査局に関連するアカウントの[2017年11月](https://democrats-intelligence.house.gov/uploadedfiles/exhibit_b.pdf)と[2018年6月](https://democrats-intelligence.house.gov/uploadedfiles/ira_handles_june_2018.pdf)のリストです。このデータセットには、2017年11月のリストにある2,752個のアカウントから2015年5月10日以降に送信されたすべてのツイートが含まれています。2018年6月のリストに新たに追加された946個のアカウントについては、このデータには2015年6月19日以降のすべてのツイートが含まれています。(一部のアカウントでは、データはこれらの期間よりも前までさかのぼっています。リストにある一部のアカウントはこれらの期間中にツイートをしていません。)研究者は、これにはこれらのアカウントの活動の大部分が含まれていると考えています。研究者はまた、2018年6月のリストに残っていたが、インターネット調査局のトロールである可能性が非常に低いと彼らが判断した19個のアカウントを削除しました。
合計で、9つのCSVファイルには、2,848個のツイッターアカウントからの2,973,371件のツイートが含まれています。また、いつも通り、購入者注意です。この場合は、ツイートを読む人に注意してください。一部のツイートには、それ自身の内容に加えて、成人向けの内容やそれ以上のものにつながる可能性のあるアクティブなリンクが含まれています。
クレムソン大学の研究者は、このデータを研究論文「[トロール工場:インターネット調査局と国家支援による議題設定](http://pwarren.people.clemson.edu/Linvill_Warren_TrollFactory.pdf)」で使用しています。この論文は現在、学術雑誌で査読中です。この論文での著者の分析は、ここで提供されているデータファイルを使って行われ、日付範囲は2015年6月19日から2017年12月31日に限定されています。
これらのファイルには以下の列があります。
ヘッダー | 定義
---|---------
`external_author_id` | ツイッターの投稿者アカウントID
`author` | ツイートを送信するアカウント名
`content` | ツイートの本文
`region` | [Social Studioによって決定された](https://help.salesforce.com/articleView? id=000199367&type=1)地域分類
`language` | ツイートの言語
`publish_date` | ツイートが送信された日時
`harvested_date` | Social Studioによってツイートが収集された日時
`following` | ツイート時点でアカウントがフォローしていたアカウントの数
`followers` | ツイート時点でアカウントが持っていたフォロワーの数
`updates` | ツイートを投稿したアカウントに対する「更新アクション」の数(ツイート、リツイート、いいねを含む)
`post_type` | ツイートがリツイートまたは引用ツイートであるかを示す
`account_type` | リンヴィルとウォーレンによってコード化された特定のアカウントのテーマ
`retweet` | ツイートがリツイートであるかどうかを示すバイナリ指標
`account_category` | リンヴィルとウォーレンによってコード化された一般的なアカウントのテーマ
`new_june_2018` | アカウントが2018年6月に新たにリストに載ったかどうかを示すバイナリ指標
このデータを使用して面白いことを見つけた場合は、ぜひ私たちに知らせてください。あなたのプロジェクトをoliver.roeder@fivethirtyeight.comまたは[@ollie](https://twitter.com/ollie)に送ってください。
クレムソン大学の研究者は、クレムソン大学ソーシャルメディアリスニングセンターとノックスビルのテネシー大学のブランドン・ボートライトの支援を認めたいと思っています。
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.