Open Dataset
Data Structure ?
4279.53M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
データセットは[Jessica Li][1]によってアップロードされました
----------
背景
物体認識と画像処理は、現実世界での膨大で創造的な潜在的な応用があるため、機械学習において最も人気のあるトピックの1つになっています。機械学習アルゴリズムを使用して視覚情報を処理する能力は非常に有用です。例えば、[街の画像を通じてニューヨークシティの自転車レーンの品質を測定する][2]などです。この分野では、Street View House Numbers(SVHN)データセットが最も人気のあるデータセットの1つです。このデータセットは、[Googleが作成したニューラルネットワーク][3]で使用され、住宅番号を読み取り、それらを地理的位置にマッチさせています。これは、道路番号を正確に識別するモデルを遊び、学習し、トレーニングするための素晴らしいベンチマークデータセットであり、あらゆるプロジェクトに組み込むことができます。
内容
このデータセットには、Google Street Viewから撮影された60万枚以上のラベル付きの実世界の住宅番号の画像が含まれる3つの.zipファイルが含まれています。画像内の数字の並びは長さが制限されています。
- **test.zip**:テスト用の26,032個の数字
- **train.zip**:トレーニング用の73,257個の数字
- **extra.zip**:追加のトレーニングデータとして使用するための531,131個の追加の、やや難易度の低いサンプル
**追加情報**
- 10のクラスがあり、各数字に1つのクラスが割り当てられています。数字の'1'はラベル1、'9'はラベル9、'0'はラベル10を持ちます。
- 画像は、元の可変解像度のカラー住宅番号の画像で、文字レベルのバウンディングボックスが付いた.png形式です。
- **digitStruct.mat**:それぞれの.zipファイルに関するバウンディングボックスの情報が**digitStruct.mat**として保存されており、Matlabを使用して読み込むことができます。digitStruct.matファイルには、元の画像の数と同じ長さのdigitStructという構造体が含まれています。
- digitStruct内の各要素には、次のフィールドがあります。
- **name**:対応する画像のファイル名を含む文字列
- **bbox**:画像内の各数字のバウンディングボックスの位置、サイズ、およびラベルを含む構造体配列。例えば、digitStruct(300).bbox(2).heightは、300番目の画像内の2番目の数字のバウンディングボックスの高さを返します。
謝辞
SVHNデータセットは、http://ufldl.stanford.edu/housenumbers/ から提供されています。バナー写真は、UnsplashのAnnie Sprattによるものです。
このデータを紹介し、検討した元の論文:
Yuval Netzer, Tao Wang, Adam Coates, Alessandro Bissacco, Bo Wu, Andrew Y. Ng Reading Digits in Natural Images with Unsupervised Feature Learning NIPS Workshop on Deep Learning and Unsupervised Feature Learning 2011.
インスピレーションとリソース
- テストデータとトレーニングデータが与えられた場合、画像内の住宅番号を正確に識別するモデル(KerasやTensorFlowを試してみてください)をトレーニングできますか(画像の明るさやぼやけなどの難しさがある場合も)?
- このような物体検出データセットと統合して新しいアプリケーションを形成できる興味深いデータセットは何ですか?
- 追加のリソースは、[SVHNデータセットの始め方][4]と、Tensorflowの畳み込みネットワークを使用してSHVNデータセットに取り組むことを目的とした[Ji Yanのプロジェクト][5]です。
[1]: https://www.kaggle.com/jessicali9530
[2]: https://medium.com/a-r-g-o/classifying-nyc-bike-lane-quality-with-image-processing-and-computer-vision-in-python-76b13147ec2d
[3]: https://www.technologyreview.com/s/523326/how-google-cracked-house-number-identification-in-street-view/
[4]: https://agi.io/2018/01/31/getting-started-street-view-house-numbers-svhn-dataset/
[5]: https://experimentationground.wordpress.com/2016/09/26/digit-recognition-from-google-street-view-images/
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.