Select Language

Open Dataset

2019新型コロナウイルス感染症の時系列データウェアハウス

2019新型コロナウイルス感染症の時系列データウェアハウス

528 hits
0 likes
11 downloads
0 discuss
Medical Classification

Data Structure ? 0M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    本プロジェクトは2019新型コロナウイルス(COVID - 19/2019 - nCoV)の感染状況に関する時系列データウェアハウスであり、データのソースは丁香園です。

    データは2019新型コロナウイルス感染状況のリアルタイムクローラーによって取得され、1時間ごとに更新を確認し、更新があればデータウェアハウスに追加されます。

    CSVファイルリスト

    1. 全国データDXYOverall.csv
    2. 地域データDXYArea.csv(英語の都市名を含む)
    3. ニュースデータDXYNews.csv
    4. 噂データDXYRumors.csv

    データ説明:

    1、一部のデータには重複集計の状況があります。例えばIssue #21に記載されているように、河南省の一部の市レベルのデータには「南陽(鄧州を含む)」と「鄧州」の2つのデータがあり、合計を計算する際に「鄧州」のデータが1回重複して計算されます。

    データ異常:

    現在、浙江省/湖北省の一部の時系列データにデータ異常が見つかっています。原因としては、丁香園のデータが手入力であるため、入力ミスがある可能性があります。例えば、ある時点でクローラーが取得した浙江省の治癒者数が537人で、数分後に正常な人数に修正されました。

    本プロジェクトのクローラーは丁香園の公開データからのみデータを取得し保存するだけで、異常値の判断や処理は行いません。したがって、本データを科研目的で使用する場合は、自分でデータのクリーニングを行ってください。同時に、Issueで異常データのフィードバックチャネルを開設しています。この問題で潜在的な異常データを直接フィードバックできます。定期的に確認し処理します。

    詳細な情報はGitHubリポジトリをご覧ください。

    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:0 Go earn points?
    • 528
    • 11
    • 0
    • collect
    • Share