Select Language

Open Dataset

Deepfake検出チャレンジ、顔または音声操作を通じて動画を識別する

Deepfake検出チャレンジ、顔または音声操作を通じて動画を識別する

471.84G
838 hits
1 likes
0 downloads
0 discuss
Person,Face 2D Box

データ量は高達472GBで、119,197個のビデオを含んでいます。各ビデオの長さはすべて10秒ですが、フレームレートは15~30fpsまで様々で、解像度も320×240~3840×2160までです。......

Data Structure ? 471.84G

    README.md

    データ量は高達472GBで、119,197個のビデオが含まれています。各ビデオの長さはすべて10秒ですが、フレームレートは15~30fpsまで様々で、解像度も320×240~3840×2160まで様々です。トレーニングビデオのうち、19,197個のビデオは約430人の俳優による実際の撮影クリップで、残りの100,000個のビデオは実際のビデオから生成された偽顔ビデオです。偽顔の生成には、DeepFakes、GANベース、および一部の非学習型の方法が使用され、データセットにできるだけ多くの偽顔ビデオが含まれるようにしています。このデータセットのビデオには音声が含まれており、これは現在のほとんどのデータセットにはない特徴ですが、音声に関するアノテーション情報はありません。公式サイトおよびKaggleコンペのリーダーボードのランキング情報によると、現在のSOTAスコアの損失は0.42程度で、まだ大きな改善の余地がありますが、計算リソースの要求が高く、調査によると一部の人は8枚以上のV100 GPUを使用しているため、このデータセットを使用した論文は少ないです。

    このコンペティションは提出受付を締め切りました。参加者が選択したコード提出物は、主催者によって非公開のテストセットで再実行され、プライベートリーダーボードの結果が確定しました。このコンペティションの独自の設計を再現できないため、遅れての提出は受け付けません。

    トレーニングセット

    このコードコンペティションのトレーニングセットは、Kaggleでは直接利用できません。そのサイズが大きすぎて、Kaggleでトレーニングするには不適切だからです。代わりに、オフラインでトレーニングし、外部でトレーニングしたモデルを外部データセットとしてKaggleノートブックに読み込み、テストセットに対して推論を行うことを強くおすすめします。詳細情報については、「はじめに」を確認してください。

    完全なトレーニングセットは470GBを少し超えています。私たちは、それを1つの巨大なファイルとして、およびそれぞれ約10GBのサイズの50個の小さなファイルとして提供しています。以下のリンクのいずれかにアクセスするには、コンペティションのルールに同意する必要があります。


    ファイル

    • train_sample_videos.zip - トレーニングビデオのサンプルセットと、ラベル付きのmetadata.jsonを含むZIPファイル。完全なトレーニングビデオセットは、上記のリンクを通じて入手できます。

    • sample_submission.csv - 正しい形式のサンプル提出ファイル。

    • test_videos.zip - 公開検証セットとして使用される少量のビデオを含むZIPファイル。

    このコンペティションで利用可能なデータセットを理解するには、「はじめに」の情報を確認してください。

    • filename - ビデオのファイル名

    • label - ビデオがREAL(真)かFAKE(偽)か

    • original - トレーニングセットのビデオがFAKEの場合、元のビデオがここに記載されます

    • split - これは常に「train」(トレーニング)に等しいです。




    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:50 Go earn points?
    • 838
    • 0
    • 1
    • collect
    • Share