Open Dataset
Data Structure ?
1.99G
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
第1回野外自動顔ランドマーク検出チャレンジ(300 - W 2013)は、2013年オーストラリアのシドニーで開催される国際コンピュータビジョン会議(ICCV 2013)と併せて開催されます。
主催者
ギオルギオス・ツィミロポウロス、英国リンカーン大学
ステファノス・ザフェリオウ、英国ロンドン帝国大学
マヤ・パンティック、英国ロンドン帝国大学
目的
自動顔ランドマーク検出は、コンピュータビジョンにおける長年の問題であり、300 - Wチャレンジはこの分野の取り組みを評価するために専門的に組織された初のイベントです。特に注目されるのは、野外で撮影された顔画像の実世界データセットにおける顔ランドマーク検出です。チャレンジの結果は、ICCV 2013と併せて開催される300 - W野外顔ワークショップで発表されます。
Image and Vision Computingジャーナルの特別号では、最も性能の高い手法を紹介し、チャレンジの結果をまとめます。
300 - Wチャレンジ
4つの人気データセットについて、(Multi - PIE [1]の68点マークアップに従った)ランドマーク注釈(図1を参照)は、ここから入手できます。チャレンジのすべての参加者は、これらのデータを使用してアルゴリズムを訓練することができます。性能評価は、同じMulti - PIEマークアップと同じ顔のバウンディングボックス初期化を使用して、300 - Wテストセットで行われます。
![]() | ![]() |
図1:私たちの注釈に使用される68点と51点のマークアップ。
訓練
データセットLFPW [2]、AFW [3]、HELEN [4]、およびXM2VTS [5]は、図1のマークアップを使用して再注釈付けされています。私たちは、難しいポーズと表情の別の135枚の画像(IBUG訓練セット)に追加の注釈を提供しています。注釈は、対応する画像と同じ名前を持っています。LFPW、AFW、HELEN、およびIBUGデータセットについては、画像も提供しています。残りの画像データベースは、著者のウェブサイトからダウンロードできます。すべての注釈は、ここからダウンロードできます。
参加者は、これらの訓練データを使用してアルゴリズムを訓練することを強く推奨します。提供された注釈のいずれかを使用する場合は、[6]と対応するデータベースを紹介する論文を引用してください。
このチャレンジの再注釈付きデータは、Matlabの慣例で1が最初のインデックスとして保存されていることに注意してください。つまり、画像の左上のピクセルの座標はx = 1、y = 1です。
テスト
参加者は、野外で収集された2x300(300枚の屋内と300枚の屋外)の顔画像の新しく収集されたデータセット(300 - Wテストセット)でアルゴリズムをテストします。サンプル画像を図2と図3に示します。
![]() | ![]() |
図2:屋外。 | 図3:屋内。 |
300 - Wテストセットは、現在のシステムが、ポーズ、表情、照明、背景、遮蔽、および画像品質の変動に関係なく、未見の被験者を扱う能力をテストすることを目的としています。
参加者は、訓練済みのアルゴリズムを含むバイナリファイルを主催者に送付する必要があります。主催者は、同じバウンディングボックス初期化を使用して、300 - Wテストセットで各アルゴリズムを実行します。このバウンディングボックスは、当社の社内顔検出器によって提供されます。当社の検出器が訓練された顔領域は、ランドマーク注釈によって計算されたバウンディングボックスによって定義されます(図4を参照)。
図4:当社の顔検出器が訓練された顔領域(バウンディングボックス)。
バウンディングボックスの初期化の例と、正解のバウンディングボックスを図5に示します。 私たちは、訓練手順の各データベースについて、当社の社内検出器によって生成されたバウンディングボックスの初期化を提供しています。さらに、正解のバウンディングボックスも示されています。
![]() | ![]() |
図5:LFPWのテストセットの画像のバウンディングボックス初期化の例。
参加者は、300 - Wテストセットの初期化が同程度の精度であることを期待すべきです。
各バイナリファイルは、2つの入力を受け取る必要があります:入力画像(.png拡張子のRGB画像)とバウンディングボックスの座標。バウンディングボックスは4x1のベクトル[xmin, ymin, xmax, ymax]である必要があります(図6を参照)。バイナリファイルの出力は、検出されたランドマークを含む68 x 2の行列である必要があります。この行列は、提供された注釈と同じ形式(.pts)と順序で保存する必要があります。
図6:バウンディングボックスの座標(左上のピクセルの座標はx = 1、y = 1)。
顔ランドマーク検出の性能は、図1の68点マークアップと、境界なしの点に対応する51点の両方で評価されます(図1を参照)。眼間距離(目の外側の角の間のユークリッド距離として測定)で正規化された平均点間ユークリッド誤差が、誤差測度として使用されます。誤差を計算するためのMatlabコードは、http://ibug.doc.ic.ac.uk/media/uploads/competitions/compute_error.mからダウンロードできます。最後に、誤差が特定の値未満であったテスト画像の割合に対応する累積曲線が生成されます。さらに、フィッティング時間が記録されます。これらの結果は、参加者に返され、彼らの論文に含めることができます。
コンペティションに提出されたバイナリファイルは、機密扱いとなります。 これらはコンペティションの目的のみに使用され、完了後に削除されます。バイナリファイルは64ビットマシンでコンパイルする必要があり、公開されているビジョンリポジトリ(Open CVなど)への依存関係は、バイナリファイルに添付されたドキュメントに明示的に記載する必要があります。
優勝者
J. Yan、Z. Lei、D. Yi、およびS. Z. Li。 顔アライメントのための複数の仮説を組み合わせる方法を学ぶ。(学界)
E. Zhou、H. Fan、Z. Cao、Y. Jiang、およびQ. Yin。 粗から細への畳み込みネットワークカスケードによる顔ランドマークの位置特定。 (産業界)
結果
屋内
![]() | ![]() |
51点 | 68点 |
屋外
![]() | ![]()
×
The dataset is currently being organized and other channels have been prepared for you. Please use themThe dataset is currently being organized and other channels have been prepared for you. Please use themNote: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
Go share your ideas~~
ALLWelcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:II. Ownership Explanation:III. Data Reposting Explanation:IV. Infringement and Handling Explanation: |