Select Language

Open Dataset

VidTIMIT 音声ビデオデータセット

VidTIMIT 音声ビデオデータセット

3088.22M
625 hits
0 likes
4 downloads
0 discuss
Earth and Nature,Music,Image Data,Linguistics,Video Data Classification

Data Structure ? 3088.22M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    このデータセットは、http://conradsanderson.id.au/vidtimit/ からコピーされました。 ビデオフォルダ内の番号付きのファイルは.jpg形式です(拡張子が欠落しています)。 私はこのデータセットの作成者ではありません! 以下は、そのウェブサイトからの引用です: フォルダ内の発話された単語の例文: sa1: 彼女は一年中、あなたの黒いスーツを油っぽい洗濯水の中に入れていました sa2: 私にそんな油っぽい雑巾を持たせないでください si1398: 彼らは階級偏見のある決定をするのでしょうか? si2028: 彼は額からマスクを取り外して、思いがけなくデッキの向こう側に投げました si768: 砂糖壺の蓋を瓶の蓋と同じように作り、デザイン用の円盤は省きます sx138: 不器用な客が高価な香水をこぼしました sx228: 展望台からは海が見えました sx318: 霜が降る前に私のジャガイモを掘り取ってください sx408: 私は地下鉄に乗りたいですが、切符代が足りません sx48: 祖母はペチコートを着る時代を越えました (これらは単なる例です。完全なリストはこちらで見ることができます:https://catalog.ldc.upenn.edu/docs/LDC93S1/PROMPTS.TXT) 概要 VidTIMITデータセットは、43人の人物が短い文章を朗読するビデオとそれに対応する音声録音から構成されています。自動唇読み、多視点顔認識、マルチモーダル音声認識、人物識別などの研究に役立つ可能性があります。 このデータセットは3回のセッションで録音されました。セッション1と2の間の平均間隔は7日、セッション2と3の間は6日です。文章はTIMITコーパスのテストセクションから選ばれました。一人当たり10文あります。最初の6文(ファイル名でアルファベット順に並べられたもの)はセッション1に割り当てられ、次の2文はセッション2に、残りの2文はセッション3に割り当てられます。 すべての人物の最初の2文は同じで、残りの8文は一般的に各人ごとに異なります。 文章に加えて、各人は各セッションで頭を回すシーケンスを行いました。このシーケンスは、人物が頭を左に動かし、右に動かし、中央に戻し、上に動かし、下に動かし、最後に中央に戻るというものです。 録音は、放送品質のデジタルビデオカメラを使用してオフィス環境で行われました。各人のビデオは、解像度512×384ピクセルのJPEG画像の番号付きシーケンスとして保存されています。JPEG画像の作成時には90%の品質設定が使用されました。対応する音声は、モノラル、16ビット、32kHzのWAVファイルとして保存されています。 ダウンロード前に必ず読んでください ライセンス VidTIMITデータセットは、Copyright © 2001 Conrad Sanderson です。 このデータセットの配布と研究目的での使用は、以下の条件の下で許可されます。 この通知はそのまま残され、一切変更されないこと。 データセットは現状のまま提供されます。特定の目的に適合することに関する保証は一切ありません。 データセットの作成者は、データセットの使用に起因する直接的または間接的な損失について一切責任を負いません。 VidTIMITの使用によって生じるすべての出版物(例:会議論文、学術論文、技術報告書、書籍の章など)は、以下の論文を引用しなければなりません。 C. Sanderson and B.C. Lovell Multi-Region Probabilistic Histograms for Robust and Scalable Identity Inference. Lecture Notes in Computer Science (LNCS), Vol. 5558, pp. 199-208, 2009. 注意事項 VidTIMITデータセットは合計44個のファイルから構成され、全体で約3GBの容量を占めています。各zipファイルの平均サイズは71MBです。 一度に1つのファイルのみをダウンロードしてください。これはサーバーに過負荷がかからないようにするためです。
    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:0 Go earn points?
    • 625
    • 4
    • 0
    • collect
    • Share