Select Language

Open Dataset

MDB - WIKI – 50万枚以上の年齢と性別のラベル付き顔画像

MDB - WIKI – 50万枚以上の年齢と性別のラベル付き顔画像

280G
706 hits
3 likes
0 downloads
0 discuss
Person,Image Search,Deep Learning Classification

私たちの知る限り、これは性別と年齢のラベルが付いた顔画像の最も大規模な公開データセットです。......

Data Structure ? 280G

    README.md

    私たちの知る限り、これは性別と年齢のラベル付きの顔画像のうち、トレーニング用として公開されている最大のデータセットです。私たちは年齢予測と性別予測の両方に対して事前学習済みのモデルを提供しています。

    説明

    公開されている顔画像データセットは多くの場合中小規模で、数万枚を超えることはめったになく、しかも多くの場合年齢情報が含まれていません。そこで、私たちは有名人の大規模なデータセットを収集することにしました。この目的のために、IMDbウェブサイトに掲載されている最も人気のある10万人の俳優のリストを取得し、(自動的に)彼らのプロフィールから生年月日、名前、性別、そしてその人物に関連するすべての画像をクロールしました。 さらに、Wikipediaの人物ページから同じメタ情報を持つすべてのプロフィール画像をクロールしました。 タイムスタンプ(写真が撮影された日付)のない画像は削除しました。 単一の顔が写っている画像はおそらく俳優を映しており、タイムスタンプと生年月日が正しいと仮定すると、そのような各画像に生物学的(実際の)年齢を割り当てることができました。もちろん、割り当てた年齢情報の正確性を保証することはできません。誤ったタイムスタンプの他に、多くの画像は映画の静止画であり、映画の制作期間は長くなる可能性があります。合計で、IMDbから20,284人の有名人の460,723枚の顔画像と、Wikipediaから62,328枚の画像を取得し、合計で523,051枚になりました。

    一部の画像(特にIMDbからのもの)には複数の人物が写っているため、2番目に強い顔検出スコアが閾値を下回る写真のみを使用します。ネットワークがすべての年齢に対して同等の識別能力を持つように、トレーニング用の年齢分布を均等化します。詳細については、論文を参照してください。

    使用方法

    IMDbとWikipediaの画像の両方について、すべてのメタ情報を含む別々の.matファイルを提供しています。このファイルはMatlabで読み込むことができ、形式は以下の通りです。

    • dob: 生年月日(Matlabのシリアル日付番号)

    • photo_taken: 写真が撮影された年

    • full_path: ファイルへのパス

    • gender: 女性は0、男性は1、不明の場合はNaN

    • name: 有名人の名前

    • face_location: 顔の位置。Matlabで顔を切り抜くには次のコマンドを実行します

      img(face_location(2):face_location(4),face_location(1):face_location(3),:))
    • face_score: 検出器のスコア(数値が高いほど良い)。Infは画像内に顔が見つからなかったことを意味し、face_locationは画像全体を返します

    • second_face_score: 2番目に高いスコアの顔の検出器スコア。これは、複数の顔が写っている画像を除外するのに役立ちます。2番目の顔が検出されなかった場合は、second_face_scoreNaNになります。

    • celeb_names (IMDBのみ): すべての有名人の名前のリスト

    • celeb_id (IMDBのみ): 有名人の名前のインデックス

    人物の年齢は、生年月日と写真が撮影された時期(写真は年の真ん中に撮影されたと仮定します)に基づいて計算することができます。

    [age,~]=datevec(datenum(wiki.photo_taken,7,1)-wiki.dob);


    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:65 Go earn points?
    • 706
    • 0
    • 3
    • collect
    • Share