Select Language

Open Dataset

街頭風景の建物番号(SVHN)データセット、オブジェクト認識アルゴリズムに使用できる実際の画像データセット

街頭風景の建物番号(SVHN)データセット、オブジェクト認識アルゴリズムに使用できる実際の画像データセット

3.91G
1980 hits
2 likes
3 downloads
0 discuss
NLP,OCR/Text Detection,Business,Image Search 2D Box

SVHNは機械学習と物体認識アルゴリズムの開発に使用される実画像データセットであり、データの前処理とフォーマット化に対する要求が最低限です。それはMNISTとスタイルが似ていると見なすことができます......

Data Structure ? 3.91G

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    SVHNは、機械学習と物体認識アルゴリズムの開発に使用される実画像データセットであり、データの前処理とフォーマット化に対する要求が最小限です。これはMNISTとスタイルが似ていると見なすことができます(例えば、画像は小さな切り抜き数字です)が、1桁以上多いラベル付きデータ(60万以上の数字の画像)を含んでおり、より難しい未解決の現実世界の問題(自然シーン画像中の数字と数字列の認識)に由来しています。SVHNは、Googleストリートビューの画像から取得された門番に基づいています。

    • 10クラス、各数字に1つ。数字「1」のラベルは1、「9」のラベルは9、「0」のラベルは10です。

    • 訓練用に73257個の数字、テスト用に26032個の数字、そして追加の訓練データとして使用できる多少難易度の低い531131個のサンプルがあります。

    • 2種類のフォーマットがあります:

      • 1. 文字レベルのバウンディングボックス付きのオリジナル画像。

      • 2. 単一の文字を中心としたMNISTのような32×32の画像(多くの画像の側面には迷惑要素が含まれています)。

    技術的詳細

    フォーマット1:完全な数字

    これらは、上のサンプル画像に示されているように、文字レベルのバウンディングボックス付きのオリジナルの可変解像度のカラー住宅番号画像です。(サンプル画像の青いバウンディングボックスは説明用です。バウンディングボックスの情報は、データセットの画像に直接描画されるのではなく、digitStruct.matに保存されています。)

    各tar.gzファイルには、png形式のオリジナル画像と、Matlabで読み込むことができるdigitStruct.matファイルが含まれています。digitStruct.matファイルには、digitStructという構造体が含まれており、その長さはオリジナル画像の数と同じです。digitStructの各要素には、以下のフィールドがあります:nameは、対応する画像のファイル名を含む文字列です。bboxは、画像内の各数字のバウンディングボックスの位置、サイズ、およびラベルを含む構造体配列です。

    例:digitStruct(300).bbox(2).heightは、300番目の画像内の2番目の数字のバウンディングボックスの高さを示します。

    フォーマット2:切り抜き数字

    MNISTのような形式での文字レベルの正解データです。すべての数字は、32×32ピクセルの固定解像度にリサイズされています。元の文字のバウンディングボックスは、適切な次元で拡張されて正方形のウィンドウになり、32×32ピクセルにリサイズしてもアスペクト比の歪みが生じません。ただし、この前処理により、対象の数字の側面にいくつかの「迷惑」な数字が導入されます。.matファイルを読み込むと、2つの変数が作成されます:Xは画像を含む4次元行列で、yはクラスラベルのベクトルです。

    画像にアクセスするには、X(:,:,:,i)でi番目の32×32のRGB画像が得られ、そのクラスラベルはy(i)です。

    参考文献

    このデータセットを使用した論文では、以下の参考文献を引用してください:

    1. Yuval Netzer, Tao Wang, Adam Coates, Alessandro Bissacco, Bo Wu, Andrew Y. Ng Reading Digits in Natural Images with Unsupervised Feature Learning NIPS Workshop on Deep Learning and Unsupervised Feature Learning 201 (PDF)

    提出ファイル

    免責事項

    このデータセットは、非商用利用のみを目的として提供されています。

    データセットをダウンロードして使用することにより、その出所を認め、関連する出版物で上記の論文を引用することに同意するものとします。このデータセットについては、著者のURL http://ufldl.stanford.edu/housenumbers をリンクしてください。

    著者への問い合わせ

    データセットに関する質問は、streetviewhousenumbers@gmail.com までお問い合わせください。


    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:12 Go earn points?
    • 1980
    • 3
    • 2
    • collect
    • Share