Open Dataset
Data Structure ?
32.2G
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
コンピュータビジョンの核心的な目標は、アルゴリズムに画像を賢く記述する能力を与えることです。目標検出は規範的な画像記述タスクであり、これはアプリケーションにおいて非常に実用的であり、既存の設定で直接ベンチマークテストを行うことができます。そして、物体検出器の精度は著しく向上しており、画像分割や3D表現などの新機能も開発されています。
少数の例から効果的に学習することは、機械学習とコンピュータビジョンにおける重要な未解決問題です。科学的および実践的な観点から、この機会は非常に魅力的です。しかし、この分野を実証研究の対象とするには、適切な高品質のデータセットとベンチマークが必要です。私たちの目標は、大規模な語彙量を持つインスタンス分割研究用のベンチマークデータセットであるLVISを設計・収集することにより、この新しい研究方向を実現し、最終的に1000種類の物体を含む約200万枚の高品質なインスタンス分割アノテーション画像からなる164kサイズのデータセットを完成させることです。
LVIS紹介
1200以上のカテゴリ164k枚の画像におけるデータ駆動型の物体発見により見つけられました。
ロングテール
カテゴリの発見により、自然に多数の稀なカテゴリが明らかになります。
マスク
200万枚以上の高品質なインスタンス分割マスク。
LVISデータセット
v1.0
学習セット
1,270,141個のインスタンス (1GB)
100,170枚の画像 (18GB)
検証セット
244,707個のインスタンス (192MB)
19,809枚の画像 (1GB)
テスト開発セット
情報 (4MB)
19,822枚の画像 (6GB)
テストチャレンジセット
情報 (4MB)
19,822枚の画像 (6GB)
このデータを使用する際の推奨されるベストプラクティスをご覧ください。
注意: LVISはCOCO 2017の学習、検証、テスト画像セットを使用しています。もしすでにCOCO画像をダウンロードしている場合は、LVISのアノテーションのみをダウンロードすればよいです。LVISの検証セットには、COCO 2017の検証分割に加えて、COCO 2017の学習画像も含まれています。
データ形式
LVISのインスタンス分割アノテーションは、COCOに似た形式で保存されています。アノテーションはJSON形式で保存されています。LVIS APIを使用して、アノテーションにアクセスしたり操作したりすることができます。JSONファイルは以下の形式になっています:
{
info : 情報
images : [画像],
annotations: [アノテーション],
licenses : [ライセンス],
}
info{
year : 整数
version : 文字列,
description : 文字列,
contributor : 文字列,
url : 文字列,
date_created : 日時,
}
license{
id : 整数
name : 文字列,
url : 文字列,
}
以下でデータ構造についてもう少し詳しく説明します。
画像
各画像には、2つの追加フィールドがあります。 not_exhaustive_category_ids
: すべてのインスタンスが網羅的にマークされていないカテゴリIDのリスト。
neg_category_ids
: 画像内に存在しないことが確認されたカテゴリIDのリスト。
coco_url
:
画像のURL。最後の2つのパス要素は、COCOデータセットの分割とファイル名を識別します(例:http://images.cocodataset.org/train2017/000000391895.jpg)。この情報を使用して、ダウンロードしたCOCOデータセットのコピーから正しい画像を読み込むことができます。
not_exhaustive_category_ids
: すべてのインスタンスが網羅的にマークされていないカテゴリIDのリスト。
neg_category_ids
: 画像内に存在しないことが確認されたカテゴリIDのリスト。
coco_url
:
画像のURL。最後の2つのパス要素は、COCOデータセットの分割とファイル名を識別します(例:http://images.cocodataset.org/train2017/000000391895.jpg)。この情報を使用して、ダウンロードしたCOCOデータセットのコピーから正しい画像を読み込むことができます。
image{
id : 整数
width : 整数,
height : 整数,
license : 整数,
flickr_url : 文字列,
coco_url : 文字列,
date_captured : 日時,
not_exhaustive_category_ids : [整数],
neg_category_ids : [整数],
}
カテゴリ
LVISのカテゴリは、WordNetの同義語セットに大まかに基づいています。 synset
: 各カテゴリに対して一意の文字列識別子を提供します。WordNet
synset
: 各カテゴリに対して一意の文字列識別子を提供します。WordNet
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
- Share your thoughts
ALL
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.