Open Dataset
Data Structure ?
2347.61M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
文脈:
有害大気汚染物質は、有毒大気汚染物質または大気毒性物質とも呼ばれ、癌やその他の重大な健康影響(生殖への影響や先天性欠損など)、あるいは環境への悪影響を引き起こすことが知られている、または疑われる汚染物質です。環境保護庁(EPA)は187種類の大気汚染物質を追跡しています。詳細については[https://www.epa.gov/haps/](https://www.epa.gov/haps/)を参照してください。
内容:
日次要約ファイルには、環境保護庁(EPA)のデータベース内のすべてのモニター(サンプリングされたパラメーター)に関する1日ごとのデータが含まれています。このファイルには、以下のような日次要約レコードが含まれます。
1. モニターで行われたすべての日次以下の測定値の集計。
2. モニターが1日に1回のサンプリングを行う場合の単一のサンプル値(例えば、24時間の持続時間のサンプルが1つだけある場合)。この場合、日次平均サンプル値と日次最大サンプル値は同じ値になります。
**フィールドの説明:**
1. 州コード: モニターが設置されている州の連邦情報処理標準(FIPS)コード。
2. 郡コード: モニターが設置されている郡のFIPSコード。
3. サイト番号: 郡内でサイトを識別する一意の番号。
4. パラメーターコード: モニターが測定するパラメーターに対応するAQSコード。
5. POC: 同じサイトで同じパラメーターを測定する異なる機器を区別するために使用される「パラメーター出現コード」。
6. 緯度: 測定サイトの赤道からの北の角度距離(十進度で測定)。
7. 経度: 測定サイトの本初子午線からの東の角度距離(十進度で測定)。
8. 測地系: 緯度と経度の測定に関連する測地系。
9. パラメーター名: AQSでモニターが測定するパラメーターに割り当てられた名前または説明。パラメーターは汚染物質であっても非汚染物質であってもよい。
10. サンプル持続時間: 空気が分析(測定)される前にモニタリング装置を通過する時間の長さ。つまり、大気中の平均化期間を表します(例えば、24時間のサンプル持続時間は、24時間連続して周囲の空気を捕集フィルターに通すことを意味します)。連続モニターの場合、多数のサンプルの平均化時間を表すことができます(例えば、1時間の値は、1時間の各四半期に収集された4つの1分間のサンプルの平均である可能性があります)。
11. 汚染物質基準: 統計を集計するために使用される周辺大気質基準の説明。(文書の冒頭の説明を参照)
12. 現地日付: 要約のカレンダー日付。すべての日次要約は、モニターの現地標準日(真夜中から真夜中)のものです。
13. 測定単位: パラメーターの測定単位。QADは常にパラメーターの標準単位でデータを返します。提出者は任意の単位でデータを報告することが許可されており、EPAが標準単位に変換することで、計算にデータを使用できるようになります。
14. イベントタイプ: 例外的なイベント中に測定されたデータが要約に含まれているかどうかを示します。山火事は例外的なイベントの一例です。これは大気質に影響を与えるものですが、現地の機関はコントロールできません。「イベントなし」はイベントが発生しなかったことを意味します。「イベントを含む」はイベントが発生し、それらのデータが要約に含まれていることを意味します。「イベントを除外」はイベントが発生したが、それらのデータが要約から除外されていることを意味します。「承認済みのイベントを除外」はイベントが発生したが、EPAが承認した除外のみが要約から除外されていることを意味します。問題のパラメーターについてイベントが発生した場合、各モニターに複数のレコードが存在することになります。
15. 観測数: その日に行われた観測(サンプル)の数。
16. 観測率: その日に予定されていた観測数に対する実際に行われた観測数の割合。これは、測定が必要なモニター(例えば、特定のパラメーターのみ)についてのみ計算されます。
17. 算術平均: その日の平均(算術平均)値。
18. 1日目の最大値: その日の最高値。
19. 1日目の最大値の時間: その日の最高値(前のフィールド)が測定された時間(24時間制)。
20. AQI: 該当する場合、その日の汚染物質の大気質指数。
21. 方法コード: サンプルの収集と測定に使用された方法(プロセス、機器、およびプロトコル)を示す内部システムコード。方法名は次の列にあります。
22. 方法名: サンプルの収集と測定に使用されたプロセス、機器、およびプロトコルの簡単な説明。
23. 現地サイト名: サイトを運営する州、地方、または部族の大気汚染防止機関によって付けられたサイトの名前(ある場合)。
24. 住所: 測定サイトの概略の通りの住所。
25. 州名: 測定サイトが位置する州の名前。
26. 郡名: 測定サイトが位置する郡の名前。
27. 市名: 測定サイトが位置する市の名前。これは、市の法定の編入境界を表し、都市圏ではありません。
28. CBSA名: 測定サイトが位置するコアベース統計地域(大都市圏)の名前。
29. 最終変更日: このレコード内の数値がAQSデータシステムで最後に更新された日付。
謝辞:
これらのデータはEPAから取得されたもので、2017年5月1日までの最新情報です。Kaggleでは、Kernelsを使用してこのデータを分析、共有、および議論することができます。ただし、リアルタイムの更新やより多くのデータを探している場合は、BigQueryのデータも確認してください: [https://cloud.google.com/bigquery/public-data/epa](https://cloud.google.com/bigquery/public-data/epa)。
インスピレーション:
十分な濃度と期間で有毒大気汚染物質に曝露された人は、癌にかかる可能性やその他の重大な健康影響を経験する可能性が高まります。これらの健康影響には、免疫系の損傷、神経学的、生殖(例えば、生殖能力の低下)、発達、呼吸器およびその他の健康問題が含まれます。大気毒性物質の吸入による曝露に加えて、水銀などの一部の有毒大気汚染物質は土壌や地表水に沈着し、植物に取り込まれて動物に摂取され、最終的に食物連鎖を通じて増幅されます。人間と同様に、動物も十分な量の大気毒性物質に長時間曝露されると健康問題を経験する可能性があります。このデータセットを使用して、各州で有害大気汚染物質の最も高い濃度がどこにあるかを調べてください。また、GPSの位置情報を使用して、EPAが最も多くのモニタリングステーションを持っている場所を特定し、より多くのモニタリングが必要な場所を見つけることもできます。
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.