Open Dataset
Data Structure ?
3862.33M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
文脈
機械学習用のaffNISTデータセットは、よく知られたMNISTデータセットに基づいています。しかし、今日のコンピュータは複数のCPUや時にはGPUを備えているため、MNISTはかなり小さなデータセットになっています。affNISTは、MNISTから画像を取り出し、それらに様々な適切なアフィン変換を適用することで作成されています。この過程で、画像は40×40ピクセルの大きさになり、大幅な平行移動が含まれるため、モデルにとっての大きな課題の1つは、数字が右上隅にあっても左下隅にあっても同じものを意味することを学習することです。
「カプセル」に関する研究では、物体が見つかる位置(またはより一般的な「姿勢」)を直接モデル化することが有益であることが示唆されています。affNISTは、各データケースを作成するために適用された正確な変換と、元の28×28の画像を提供することで、それを容易にすることを目指しています。これにより、入力を正規化するモデルを訓練したり、少なくとも通常の画像からどのように変形されているかを認識することができます。
変換のもう1つの効果は、データが大幅に増えることです。すべての元のMNIST画像が様々な方法で変換されています。理論的には無限のデータセットですが、実際には70,000個の元画像に基づいており、各元画像について32個のランダムに選択された変換バージョン(各元画像について異なる32個)を作成しています。これにより、合計で約200万件の訓練+検証ケースが得られます。
以下にいくつかの例を示します。左列は元のMNIST数字(40×40の画像の中央に配置)を示し、他の16列は変換されたバージョンを示しています。
謝辞
https://www.cs.toronto.edu/~tijmen/affNIST/
もしあなたがaffNISTを使用した公開された研究成果があれば、教えてください。私はそのリンクをここに載せます。
ニューラルネットワークは大量の訓練データがあるとうまく機能しますが、コンピュータは時にそれが少し重たいと感じることがあります。ダウンロードを容易にするために、ファイルのZIP圧縮バージョンを用意しました。しかし、解凍してもまだデータは大きいです。あなたのコンピュータが一度に少量の訓練データを読み込む方が楽な場合(私のコンピュータは確かにそうです)、データをバッチに分割して提供しています。各バッチには、すべてのMNIST元画像の1つの変換が含まれています。
私は各MNIST訓練ケースについて32種類の異なる変換を作成しています。つまり、約200万件の訓練/検証データケースがあります。もっと多くの変換、たとえば64種類の異なる変換を使用したい場合は、教えてください。
affNISTデータセットは、機械学習の研究を進めるのに役立つことを期待して、制限なく誰でも自由に使用できるように提供されていますが、いかなる保証もありません。
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.