Open Dataset
Data Structure ?
450.84M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
コンテキスト
内容
姿勢、照明、表情、遮蔽、個人差など、幅広い外観変化の下で確実かつ正確に動作できる顔の特徴点検出アルゴリズムを構築するために、訓練セットに高解像度のサンプルを含める必要があることに気づきました。これにより、テスト時に高解像度のテスト画像を正確に適合させることができます。数多くの顔データベースが存在しますが、特に解像度の要件を満たすものは見つかりませんでした。そのため、注釈付きのFlickr画像を使用して新しいデータセットを構築しました。
具体的には、データセットは以下のように構築されました。まず、Flickrで様々なキーワード検索を行い、大量の候補写真を収集しました。すべてのケースで、クエリには「ポートレート」というキーワードが含まれ、「家族」「屋外」「スタジオ」「少年」「結婚式」などの異なる用語が追加されました。(いくつかの異なる言語でクエリを繰り返すことで、文化的バイアスを避ける試みがなされました。)結果として得られた候補セットに顔検出器を適用し、十分に大きな顔(幅が500ピクセル以上)を含む画像のサブセットを特定しました。このサブセットはさらに手動でフィルタリングされ、偽陽性、プロファイル画像、低品質の画像が取り除かれました。各承認された顔について、顔と適切な量の背景を含む元画像の切り抜き版を生成しました。場合によっては、顔が元画像の端に非常に近い、または接触しているため、切り抜き画像では中央に位置していないことがあります。また、多くの写真には近接した複数の人物が含まれているため、切り抜き画像に他の顔のインスタンスが含まれることもあります。
最後に、画像はAmazon Mechanical Turkを使用して手動で注釈付けされ、目、鼻、口、眉毛、顎線が正確に位置特定されました。(PUT顔データベースと同じ注釈規則を採用しました。)このタスクでTurkの作業者を支援するために、点の位置をPUTデータベースで訓練されたSTASMアルゴリズムの結果で初期化しました。しかし、HelenデータセットはPUTよりもはるかに多様であるため、自動的に初期化された点はしばしば正しい位置から大きく外れていました。
いずれにせよ、この特定の注釈タスクには、高品質の結果を保証するために、通常よりも多くのデータのレビューと後処理が必要であることがわかりました。最終的にこれは、関与する自由度の数が多いことに起因しています。たとえば、Turkの作業者がコンポーネントを入れ替える(目と眉毛を交換したり、内唇と外唇を交換したり)、あるいは点の位置を十分にシフトさせてその役割を変更する(目や口角として機能する異なる頂点を選択するなど)ことが頻繁に起こりました。インターフェイスのグラフィックキュー、トレーニングビデオ、資格テストがこのプロセスを支援するために利用されました。また、データセットの一貫性と均一性を保証するための自動化プロセスも開発されました。上記に加えて、著者らはコンポーネントレベルで顔を手動でレビューし、注釈の誤りを特定しました。許容できない誤りのあるコンポーネントは、修正のためにTurkに再提出されました。
結果として得られたデータセットは、2000枚の訓練画像と330枚のテスト画像から構成され、主要な顔のコンポーネントに対する高精度、詳細、かつ一貫性のある注釈が付けられています。データセットのサンプリングは次のセクションで示されます。
謝辞
データセットはhttp://www.ifp.illinois.edu/~vuongle2/helen/ から取得されたもので、次のように引用する必要があります。
Interactive Facial Feature Localization
Vuong Le, Jonathan Brandt, Zhe Lin, Lubomir Boudev, Thomas S. Huang
ECCV2012
元の著者はVuong Le (vuongle2@gmail.com, vuongle2@illinois.edu) まで連絡することができます。
インスピレーション
私は単にこのデータセットを使って遊び、SimGANのアイデアを適用して、グレースケールのシミュレート画像をリアルなカラー画像に変換できるかどうかを確認したいと思いました。
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.