Open Dataset
Data Structure ?
393.1M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
### 背景
NASAのマゼラン宇宙船(https://www2.jpl.nasa.gov/magellan/)は1989年5月4日に打ち上げられ、1990年8月10日に金星に到達しました。マゼラン計画の主な目的は、合成開口レーダー(SAR)を用いて金星の表面をマッピングし、その地形起伏を特定することでした。レーダーマッピングが完了した時点で、表面の98%が100mより高い解像度で撮像され、多くの地域は複数回撮像されました。
宇宙船が収集したデータの分析では、金星表面に火山が存在することがわかりました。これらの火山は、火山を検出する自動機械を作るために利用できます。
### 内容
私たちはデータを「訓練用」と「テスト用」に分割して提示します。入力データ(*train_images.csv* と *test_images.csv*)は、1チャンネルの110x110の画像から構成され、画素値は0から255の範囲です。各画像は12100列の1行(110列の110行全部)として表され、これらの画像には複数の火山が含まれる場合もあれば、まったく含まれない場合もあります。これに関連して、ラベルデータまたは「正解データ」(*train_labels.csv* と *test_labels.csv*)を提示します。これは4列からなり、以下のように説明されます。
- 火山あり?:画像内に火山がある場合(**主要なターゲット**)は1、ない場合は0。
「火山あり?」が0の場合、次の3つの特徴量はNaNです。
- 種類:1 = 確実に火山、2 = おそらく火山、3 = おそらく火山、4 = ピットのみが見える
- 半径:画像中央の火山の半径(画素単位)
- 火山の数:画像内の火山の数
火山がある画像では、1つの火山が画像の中央に位置しています。著者らは「正解データ」という言葉を引用して、このデータセットには絶対的な正解がないことを思い出させています。金星に行った人はいないし、画像の質のために、人間の専門家でさえ火山を100%明確に識別することはできません。
データは不均衡であり、この点を考慮に入れる必要があります。火山がある画像の数は、火山がない画像の数より少ないです。
### 欠損値
一部の画像には、マゼランのデータ収集または通信プロセスの隙間によって生じた空白(黒)の領域が含まれています。これらの領域は一般的に無視することができます。
### 謝辞
元のデータセットは、一部がカリフォルニア工科大学ジェット推進研究所によって、米国立航空宇宙局との契約の下で作成されました。そして、UCI機械学習リポジトリ(http://archive.ics.uci.edu/ml)のおかげで、私たちは元のデータセットを使って、Kaggleで皆さんに提供するこのデータセットを作成することができました!
### インスピレーション
JARtool(jartool@aig.jpl.nasa.go)は、マゼラン宇宙船が帰した大量の金星画像から小さな火山を自動的にカタログ化するシステムを開発する先駆的な試みでした。私たちは同じ目的で元のデータセットを使ってこのデータセットを作成しました。
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.