Select Language

Open Dataset

米国連邦スーパーファンドウェブサイト

米国連邦スーパーファンドウェブサイト

845.14M
289 hits
0 likes
0 downloads
0 discuss
Social Issues and Advocacy,Linguistics,Demographics,Pollution Classification

Data Structure ? 845.14M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    コンテキスト 連邦スーパーファンドサイトは、米国で最も汚染された場所の一部です。このデータセットは、自由記述形式のテキスト説明、地理情報、人口統計、社会経済情報など、スーパーファンドに関する多面的な視点を提供します。 内容 コアデータは、米国環境保護庁(EPA)が提供する[国家優先リスト(NPL)](https://www.epa.gov/superfund/national-priorities-list-npl-sites-state)からスクレイピングされました。このテーブルは、サイト名、サイトスコア、追加日、サイト説明と現在の状況へのリンクなどの基本情報を提供します。サイト説明のPDFからテキストを抽出するために、Apache Tikaが使用されました。住所はサイトの状況ページからスクレイピングされ、緯度と経度、および国勢調査ブロックグループにジオコーディングするために使用されました。ブロックグループの割り当ては、国勢調査局の[計画データベース](https://www.census.gov/research/data/planning_database/2015/)と結合するために使用されました。このデータベースは、全国の人口統計と社会経済データの豊富な情報源です。データを生成するために使用された完全なソースコードは、[ここ、github上](https://github.com/4d4stra/Federal_Superfunds)で見つけることができます。 調査のために3つの別々のダウンロードを用意しました。 - priorities_list_full.json:すべての地理情報、サイト情報、テキスト説明、および関連するブロックグループからの国勢調査局のデータを含むNPL。 - pdb_tract.csv:トラクトレベルで集計された計画データベースで、トラクトにスーパーファンドサイトの住所が含まれているかどうかを示す追加の指標(has_superfund)が付けられています。 - pdb_block_group.csv:ブロックグループレベルで集計された計画データベースで、ブロックグループにスーパーファンドサイトの住所が含まれているかどうかを示す追加の指標(has_superfund)が付けられています。 いくつかの注意点: 1. 計画データベースには300以上の列が含まれています。これらの列の詳細な説明については、[ここ](https://www.census.gov/research/data/planning_database/2015/)のドキュメントを参照してください。 2. Googleのジオコーダーは住所の一致を提供する際に比較的積極的であるため、大きな誤差を防ぐために、クエリの階層(完全住所、市区町村・州・郵便番号、および郵便番号のみ)を通じてジオコーディングが行われました。ジオコーディングに使用された住所文字列は、'geocode_source'列を通じて示されています。 3. このデータは、ブロックグループ(pdb_tract.csvの場合はトラクト)に基づいて人口統計と社会経済データにリンクされていますが、特定のサイトの汚染の影響はこれらの地理的領域を超えて及ぶ可能性があります。 謝辞 このような詳細な情報を公開してくれたEPAと国勢調査局に感謝します。関連する学術研究については、[Burwell - Naney et al. (2013)](https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4228303/)およびその参考文献を参照してください。 このデータセットを改善するための提案があれば、ぜひ教えてください!
    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:0 Go earn points?
    • 289
    • 0
    • 0
    • collect
    • Share