Open Dataset
Data Structure ?
1.88G
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
175種の鳥類のデータセット。23,657個の訓練画像、875個のテスト画像(各種ごとに5個)、および875個の検証画像(各種ごとに5個)。
すべての画像はjpg形式の224 X 224 X 3のカラー画像で、jpg形式の「統合」画像セットも含まれています。この画像セットは、訓練、テスト、および検証画像を1つのデータセットにまとめたもので、独自の訓練、テスト、および検証セットを作成したいユーザーに役立ちます。
各種の画像はそれぞれ別のサブディレクトリに含まれています。もしあなたがディレクトリからのKerasフローを入力データとして実装する場合。
画像は、種名でインターネット検索を行って収集されました。ある種の画像ファイルをダウンロードすると、私が開発したPythonの重複画像検出プログラムを使って、重複画像が存在するかどうかを確認します。検出されたすべての重複画像を削除し、訓練、テスト、および検証セット間で共通の画像にならないようにします。
その後、画像を切り抜いて、鳥が画像の画素の少なくとも50%を占めるようにします。次に、画像をjpg形式の224 X 224 X 3にリサイズします。切り抜きにより、CNNで処理されるときに、画像に十分な情報があり、高精度の分類器を作成できるようになります。すべてのファイルは順番に番号付けされています。したがって、テスト画像は1.jpgから5.jpgと命名されています。検証画像についても同様です。訓練画像も「ゼロ」埋めで順番に番号付けされています。たとえば、001.jpg、002.jpg…010.jpg、011.jpg…099.jpg、100.jpg、102.jpgなどです。ゼロ埋めはPythonのファイル機能と一緒に使用でき、ディレクトリ内のKerasフローを維持します。
訓練セットは不均衡で、各種のファイル数が異なります。ただし、各種には少なくとも100個の訓練画像ファイルがあります。この不均衡は、私のカーネル分類器に影響を与えません。なぜなら、テストセットで98%以上の精度を達成しているからです。
データセットにおける大きな不均衡の1つは、雄の種の画像と雌の種の画像の比率です。約80%の画像が雄で、20%が雌です。典型的な雄の色ははるかに多様で、ある種の雌は通常淡白です。したがって、雄と雌の画像はまったく異なって見える可能性があります。ほとんどすべてのテストおよび検証画像は、その種の雄から取得されています。したがって、分類器は雌の種の画像では性能が悪い可能性があります。
データセットには、訓練済みのモデルファイルBIRDS - 224 - 175 - 98.62.h5とテキストファイルBIRDS - 175.txtも含まれています。これらのファイルは、付属のPredictorプログラムと組み合わせて使用されます。このプログラムは、これらのファイルを使用して、訓練済みのモデルで入力画像を予測します。フォルダPredictorテストセットには、Predictorプログラムが予測できる101個のテスト画像が含まれています。私はすぐに予測プログラムを公開します。最後に、ファイルerror list 98.62.txtがあり、これはモデルが875個のテスト画像のテストセットで持つエラーのリストを示しています。
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
- Share your thoughts
ALL
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.