Open Dataset
Data Structure ?
4.11M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
このデータセットは、[CrowdflowerのData For Everyone Library](https://www.crowdflower.com/data-for-everyone/) から提供されており、政治家のソーシャルメディアアカウントからの5000件のメッセージのテキストと、それらメッセージの目的、党派性、対象者に関する人間の判断結果が含まれています。
### データはどのように収集されたのか?
貢献者たちは、米国上院議員や他のアメリカの政治家の数千のソーシャルメディアメッセージを調べ、その内容を分類しました。メッセージは、対象者(全国またはツイート投稿者の選挙区)、偏り(中立/超党派、または偏った/党派的)に分解され、最後にメッセージ自体の実際の内容としてタグ付けされました(選択肢には、情報提供、メディア出演の告知、他の候補者への攻撃などがありました)。
### 謝辞
データは、[Crowdflower](https://www.crowdflower.com) の [Data For Everyone Library](https://www.crowdflower.com/data-for-everyone/) から提供されています。
私たちのData for Everyoneライブラリは、私たちのプラットフォームを通じて得られた好きなオープンデータジョブの集まりです。これらはコミュニティに対して無料で、永遠に利用可能です。
### インスピレーション
このデータセットを使って探ることができるいくつかの質問を紹介します。
- 党派的なメッセージと中立的なメッセージを予測する単語は何か?
- 支持メッセージと攻撃メッセージを予測する単語は何か?
- 政治家はTwitterとFacebookを異なる目的で使っているか?(例えば、Twitterは攻撃メッセージ用、Facebookは政策メッセージ用)
### データ
このデータセットには1つのファイルが含まれており、以下のフィールドがあります。
- **_unit_id**:メッセージの一意のID
- **_golden**:常にFALSE;(おそらくメッセージがCrowdflowerのゴールドスタンダードに含まれていたかどうか)
- **_unit_state**:常に "finalized"
- **_trusted_judgments**:このメッセージに対して入力された信頼できる人間の判断の数;1から3までの整数
- **_last_judgment_at**:最終判断が収集された時刻
- **audience**:*national* または *constituency* のいずれか
- **audience:confidence**:対象者の判断に対する信頼度の測定値;0.5から1までの浮動小数点数
- **bias**:*neutral* または *partisan* のいずれか
- **bias:confidence**:偏りの判断に対する信頼度の測定値;0.5から1までの浮動小数点数
- **message**:メッセージの目的。以下のいずれか:
-- *attack*:他の政治家を攻撃するメッセージ
-- *constituency*:政治家の選挙区について議論するメッセージ
-- *information*:政府や米国全体のニュースに関する情報提供メッセージ
-- *media*:メディアとのやり取りに関するメッセージ
-- *mobilization*:支持者を動員することを目的としたメッセージ
-- *other*:他のカテゴリに当てはまらないメッセージの総称カテゴリ
-- *personal*:通常、同情、支持、哀悼の表明やその他の個人的な意見を表す個人的なメッセージ
-- *policy*:政治政策に関するメッセージ
-- *support*:政治的な支持のメッセージ
- **message:confidence**:メッセージの判断に対する信頼度の測定値;0.5から1までの浮動小数点数
- **orig__golden**:常に空白;おそらくメッセージの一部がゴールドスタンダードに含まれていたかどうか
- **audience_gold**:常に空白;おそらく対象者の回答がゴールドスタンダードに含まれていたかどうか
- **bias_gold**:常に空白;おそらく偏りの回答がゴールドスタンダードに含まれていたかどうか
- **bioid**:政治家の一意のID
- **embed**:このメッセージを埋め込むためのHTMLコード
- **id**:メッセージが取得されたソーシャルメディアサイト内での一意のID
- **label**:"From: *名 姓* (*職位* from *州*)" の形式の文字列
- **message_gold**:常に空白;おそらくメッセージの回答がゴールドスタンダードに含まれていたかどうか
- **source**:メッセージが投稿された場所;"facebook" または "twitter" のいずれか
- **text**:メッセージのテキスト
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.