Select Language

Open Dataset

CACD 跨年齢顔認識と検索データセット

CACD 跨年齢顔認識と検索データセット

7.86G
1510 hits
0 likes
3 downloads
0 discuss
Face Classification

CACDデータセット(正式名称はCross - Age Celebrity Dataset)は、異なる年齢間の顔認識と検索に使用される大規模なデータセットで、インターネットから収集された2,000人のデータを含んでいます。......

Data Structure ? 7.86G

    README.md

    CACDデータセット(正式名称はCross - Age Celebrity Dataset)は、跨年齢の顔認識と検索に使用される大規模なデータセットで、インターネットから収集された2,000人の有名人の163,446枚の画像が含まれています。

    有名人の名前と年(2004 - 2013)をキーワードとして検索エンジンから画像を収集します(撮影年から生年を引くことで、画像上の有名人の年齢を簡単に推定できます)。

    このデータセットは2014年にメリーランド大学のコンピュータサイエンス学科によって公開され、関連論文はCross - Age Reference Coding for Age - Invariant Face Recognition and Retrievalです。

    概要

    現在、顔認識の研究は大きな成果を収めています。しかし、跨年齢の顔認識と検索は依然として困難な課題です。老化過程をモデル化するために強いパラメータ仮定を持つ複雑なモデルを使用する既存の方法とは異なり、我々はデータ駆動型の方法でこの問題を解決します。我々は、跨年齢参照符号化(CARC)と呼ばれる新しい符号化フレームワークを提案します。インターネット上で無料で利用できる大規模な画像データセットを参照セットとして利用することで、CARCは年齢に依存しない参照空間を使用して顔画像の低レベル特徴を符号化することができます。テスト段階では、提案された方法は特徴を符号化するために線形投影のみを必要とするため、高度な拡張性を持っています。我々の研究を徹底的に評価するために、我々は新しい大規模な跨年齢顔認識と検索データセット、跨年齢有名人データセット(CACD)を導入します。このデータセットには、16歳から62歳までの2000人の有名人の160,000枚以上の写真が含まれています。我々の知る限り、これはこれまでに公開された最大の跨年齢顔データセットです。実験結果は、提案された方法が我々のデータセットおよび跨年齢顔認識に広く使用されている他のデータセット(morphiデータセット)で最先端の性能を達成できることを示しています。

    公開情報

    • 陳柏君、陳楚松、徐文雄。Cross - Age Reference Coding for Age - Invariant Face Recognition and Retrieval, ECCV 2014 [Pdf] [Bibtex]

    • 陳柏君、陳楚松、徐文雄。Face Recognition using Cross - Age Reference Coding with Cross - Age Celebrity Dataset, IEEE Transactions on Multimedia, 2015. (受理済み) [pdf]

    データセット

    跨年齢有名人データセット(CACD)には、インターネット上の2000人の有名人の163,446枚の写真が含まれています。これらの画像は、有名人の名前と年(2004 - 2013)をキーワードとして検索エンジンから収集されました。したがって、撮影年から生年を引くことで、写真上の有名人の年齢を簡単に推定できます。ダウンロードしたデータセットには2つのMATLAB構造が含まれています:

    • celebrityData - 2,000人の有名人の情報が含まれています

      • name - 有名人の名前

      • identity - 有名人のID

      • birth - 有名人の生年

      • rank - データセットが構築されたときのIMDB.comでの同じ生年の有名人のランク

      • lfw - 有名人がLFWデータセットに含まれているかどうか

    • celebrityImageData - 顔画像の情報が含まれています

      • age - 有名人の推定年齢

      • identity - 有名人のID

      • year - 写真が撮影された推定年

      • feature - 16の顔のランドマークから抽出された75,520次元のLBP特徴

      • name - 画像のファイル名

    注意:

    *我々は手動でランクが5以下の有名人のノイズの多い画像を削除しました。しかし、一部の画像は人間にとっても識別が難しいため、データセットには依然として少量のノイズが含まれている可能性があります。また、非常に簡単な重複検出方法しか使用していないため、データセットには依然として近似重複画像が含まれている可能性があります。
    *他の有名人(ランクが5より高い)の写真にはノイズが含まれるため、評価には使用しないでください。
    *このデータセットは主に跨年齢顔認識と検索に使用されます。CACDデータセットの年次ラベルは大まかなものであるため、年齢推定の作業には適用しないことをお勧めします。


    CACD顔検索性能
    ここでは、元の特徴(高次元LBP)と提案された方法(CARC)を使用した、3つの異なるサブセットに対する顔検索の結果を報告します。すべての3つのサブセットで、2013年に撮影された画像がクエリ画像として使用されます。データベースには、それぞれ2004 - 2006年、2007 - 2009年、2010 - 2012年に撮影された3つのサブセットの画像が含まれています。すべての3つのサブセットには、ランクが3から5の有名人の画像のみが含まれています。

    データベース2004 - 20062007 - 20092010 - 2012
    方法MAPp@1MAPp@1MAPp@1
    高次元LBP36.6%78.0%38.9%80.3%44.0%85.5%
    跨年齢参照符号化52.9%88.8%55.5%88.5%61.1%92.2%
    参考文献

    1. 陳德強、曹旭、文富、孫健。“Blessing of dimensionality: High - dimensional feature and its efficient compression for face verification,” in IEEE Conf. Computer Vision and Pattern Recognition, 2013, pp. 3025– 3032.
               2. 龔東、李卓、林達、劉俊、唐曉。“Hidden factor analysis for age invariant face recognition,” in IEEE Int. Conf. Computer Vision, 2013.
               3. 陳柏君、陳楚松、徐文雄。"Face recognition and retrieval using cross - age reference coding with cross - age celebrity dataset." IEEE Transactions on Multimedia 17.6 (2015): 804 - 815.
               4. 文延東、李志峰、喬宇。"Latent factor guided convolutional neural networks for age - invariant face recognition." Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2016.
               もしあなたが我々のデータセットを使用し、結果を報告したい場合は、陳柏君までメールでご連絡ください。我々はあなたの結果をこのウェブサイトに載せることを喜んでいます。

    コード

    この論文で使用されている跨年齢参照符号化(CARC)のコードについては、[こちら]をご覧ください。

    我々はまた、高次元LBP特徴(陳、曹、文、孫、CVPR 2013)を実装しています。詳細については、[こちら]をご覧ください。

    よくある質問

    • CACDデータセットのアノテーション付き画像にどのようにアクセスできますか?

      • ランクが1 - 5の有名人の画像にはアノテーションが付けられています。ランクが1 - 2の有名人(合計80人)は検証に使用され、celebrityImageData.name{find(celebrityImageData.rank <= 2)}を使用してこれらの画像のファイル名にアクセスできます。ランクが3 - 5の有名人(合計120人)はテストに使用され、celebrityImageData.name{find(celebrityImageData.rank > 2 && celebrityImageData.rank <=5)}を使用してファイル名にアクセスできます。
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:30 Go earn points?
    • 1510
    • 3
    • 0
    • collect
    • Share