Select Language

Open Dataset

GDELTプロジェクトデータサブセット

GDELTプロジェクトデータサブセット

0.02M
672 hits
0 likes
0 downloads
0 discuss
Business,Earth and Nature,Arts and Entertainment Classification

Data Structure ? 0.02M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    コンテキスト gdeltproject.orgで述べられているように: 社会のグローバルデータベース Google Jigsawによって支援されたGDELTプロジェクトは、世界各国のほぼ隅々から、100以上の言語で放送、印刷、ウェブニュースを監視し、世界社会を毎日毎秒動かしている人物、場所、組織、テーマ、情報源、感情、数、引用、画像、イベントを特定し、世界全体の計算を行うための無料のオープンプラットフォームを構築しています。 内容 2016年3月23日から2018年3月22日までの2年間にGDELT 1.0データベースに追加された日付に基づく生データファイルを、ソース:http://data.gdeltproject.org/events/index.html からダウンロードしました。 ダウンロード後、毎日のファイルを1つのデータファイルに統合し、それをHiveデータベースのテーブルにロードしました。テーブルは国ごとにパーティション化されました。6つのランダムな国を選択しました:オーストラリア、ベルギー、フランス、インド、日本、ニュージーランド。クエリを使用して、各国の異なる属性と集計を出力しました。クエリの結果をExcelで再フォーマットし、csvファイルとして保存しました。私の目標は、大規模なデータセットを取り扱いやすいサイズに縮小し、簡単な視覚化に使用できるようにすることでした。 謝辞 GDELTプロジェクトのウェブサイト https://www.gdeltproject.org/ インスピレーション ニュースイベントを分類するために使用されるイベントコードを深く掘り下げることで、各国の一般市民の感情を把握することができます。イベントコードの分類は、イベントデータ研究のための[Conflict and Mediation Event Observations (CAMEO)][1]フレームワークに従っています。 [1]: http://data.gdeltproject.org/documentation/CAMEO.Manual.1.1b3.pdf
    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:0 Go earn points?
    • 672
    • 0
    • 0
    • collect
    • Share