Select Language

Open Dataset

DeepSat (SAT - 4)機載データセット 国家農業画像計画(NAIP)データセット

DeepSat (SAT - 4)機載データセット 国家農業画像計画(NAIP)データセット

7.25G
1030 hits
2 likes
1 downloads
0 discuss
Arts and Entertainment,Computer Science,Programming Classification

最初、画像は国家農業画像計画(NAIP)データセットから抽出されました。NAIPデータセットは、全米本土(CONUS)に広がる合計33万のシーンで構成されています。著者は......

Data Structure ? 7.25G

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    最初、画像は国家農業画像計画(NAIP)データセットから抽出されました。NAIPデータセットは、全米本土(CONUS)に広がる合計33万のシーンから構成されています。著者は、圧縮されていないデジタル直交四分円(DOQQ)を使用しました。これはGeoTIFF画像で、その区域は米国地質調査所(USGS)の地形四分円に対応しています。平均的な画像タイルの幅は約6000ピクセル、高さは約7000ピクセルで、各タイルのサイズは約200MBです。CONUSの全NAIPデータセットは約65TBです。この画像は、1メートルの地面サンプリング距離(GSD)で収集され、その水平精度は写真で識別可能な地面の制御点から6メートル以内です。

    画像は4つのバンド——赤色、緑色、青色、近赤外(NIR)——から構成されています。全NAIPデータセットに固有の高い分散を維持するために、我々はカリフォルニア州全体をカバーする様々な景観(農村地域、都市地域、茂密な森林、山岳地帯、小さなから大きな水域、農業地域など)の多数のシーン(合計1500個の画像ブロック)から画像ブロックをサンプリングしました。本研究の一部として開発された画像ラベリングツールは、特定の土地被覆クラスに属する均一な画像ブロックを手動でラベリングするために使用されます。

    ラベリングされると、均一な画像ブロックから28x28の非重複スライディングウィンドウブロックを抽出し、対応するラベルとともにデータセットに保存します。我々は、28x28をウィンドウサイズとして選択しました。これは、著しく大きなコンテキストを維持しつつ、コンテキストウィンドウ内の目標クラスの条件付き分布の相対的な統計的特性を削除するほど大きくしないためです。選択されラベリングされた画像ブロック内のクラス間の重複を避けるように注意してください。

    内容

    • 各サンプル画像は28x28ピクセルで、4つのバンド——赤色、緑色、青色、近赤外——から構成されています。

    • 訓練ラベルとテストラベルは、1x4のワンホットエンコードされたベクトルです。

    • 4つのクラスは、4つの広範な土地被覆を表しています。これには、不毛地、樹木、草地、および上記の3つ以外のすべての土地被覆クラスから構成されるクラスが含まれます。

    • 訓練データセットとテストデータセットは、互いに素な画像タイルのセットに属しています。

    • 各画像パッチは、サイズが28x28ピクセルに正規化されています。

    • 生成されると、訓練データセットとテストデータセットの両方が疑似乱数生成器を使用してランダム化されました。

    CSVファイル

    • X_train_sat4.csv:40万個の訓練画像、各画像は28x28で4チャンネル

    • y_train_sat4.csv:40万個の訓練ラベル、1x4のワンホットエンコードされたベクトル

    • X_test_sat4.csv:10万個の訓練画像、各画像は28x28で4チャンネル

    • y_test_sat4.csv:10万個の訓練ラベル、1x4のワンホットエンコードされたベクトル

    元のMATファイル

    • train_x:    28x28x4x400000 uint8(40万個の訓練サンプルを含み、各サンプルは28x28の画像で4チャンネル)

    • train_y:    400000x4 uint8(40万個の訓練サンプルのラベルを持つ4x1のベクトルを含む)

    • test_x:    28x28x4x100000 uint8(10万個のテストサンプルを含み、各サンプルは28x28の画像で4チャンネル)

    • test_y:    100000x4 uint8(10万個のテストサンプルのラベルを持つ4x1のベクトルを含む)

    謝辞

    元のMATLABファイルは複数のCSVファイルに変換されました。

    元のSAT - 4とSAT - 6の航空データセットはここにあります:

    http://csc.lsu.edu/~saikat/deepsat/

                       



    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:45 Go earn points?
    • 1030
    • 1
    • 2
    • collect
    • Share