Open Dataset

VidTIMIT 音声ビデオデータセット

3088.22M

637 hits

0 likes

4 downloads

0 discuss

Earth and Nature,Music,Image Data,Linguistics,Video Data Classification

Introduction
Data file
Related papers
Code
Discuss(0)
Instructions

Data Structure ? 3088.22M

*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

README.md

このデータセットは、http://conradsanderson.id.au/vidtimit/ からコピーされました。ビデオフォルダ内の番号付きのファイルは.jpg形式です（拡張子が欠落しています）。私はこのデータセットの作成者ではありません！以下は、そのウェブサイトからの引用です：フォルダ内の発話された単語の例文： sa1: 彼女は一年中、あなたの黒いスーツを油っぽい洗濯水の中に入れていました sa2: 私にそんな油っぽい雑巾を持たせないでください si1398: 彼らは階級偏見のある決定をするのでしょうか？ si2028: 彼は額からマスクを取り外して、思いがけなくデッキの向こう側に投げました si768: 砂糖壺の蓋を瓶の蓋と同じように作り、デザイン用の円盤は省きます sx138: 不器用な客が高価な香水をこぼしました sx228: 展望台からは海が見えました sx318: 霜が降る前に私のジャガイモを掘り取ってください sx408: 私は地下鉄に乗りたいですが、切符代が足りません sx48: 祖母はペチコートを着る時代を越えました（これらは単なる例です。完全なリストはこちらで見ることができます：https://catalog.ldc.upenn.edu/docs/LDC93S1/PROMPTS.TXT）概要 VidTIMITデータセットは、43人の人物が短い文章を朗読するビデオとそれに対応する音声録音から構成されています。自動唇読み、多視点顔認識、マルチモーダル音声認識、人物識別などの研究に役立つ可能性があります。このデータセットは3回のセッションで録音されました。セッション1と2の間の平均間隔は7日、セッション2と3の間は6日です。文章はTIMITコーパスのテストセクションから選ばれました。一人当たり10文あります。最初の6文（ファイル名でアルファベット順に並べられたもの）はセッション1に割り当てられ、次の2文はセッション2に、残りの2文はセッション3に割り当てられます。すべての人物の最初の2文は同じで、残りの8文は一般的に各人ごとに異なります。文章に加えて、各人は各セッションで頭を回すシーケンスを行いました。このシーケンスは、人物が頭を左に動かし、右に動かし、中央に戻し、上に動かし、下に動かし、最後に中央に戻るというものです。録音は、放送品質のデジタルビデオカメラを使用してオフィス環境で行われました。各人のビデオは、解像度512×384ピクセルのJPEG画像の番号付きシーケンスとして保存されています。JPEG画像の作成時には90％の品質設定が使用されました。対応する音声は、モノラル、16ビット、32kHzのWAVファイルとして保存されています。ダウンロード前に必ず読んでくださいライセンス VidTIMITデータセットは、Copyright © 2001 Conrad Sanderson です。このデータセットの配布と研究目的での使用は、以下の条件の下で許可されます。この通知はそのまま残され、一切変更されないこと。データセットは現状のまま提供されます。特定の目的に適合することに関する保証は一切ありません。データセットの作成者は、データセットの使用に起因する直接的または間接的な損失について一切責任を負いません。 VidTIMITの使用によって生じるすべての出版物（例：会議論文、学術論文、技術報告書、書籍の章など）は、以下の論文を引用しなければなりません。 C. Sanderson and B.C. Lovell Multi-Region Probabilistic Histograms for Robust and Scalable Identity Inference. Lecture Notes in Computer Science (LNCS), Vol. 5558, pp. 199-208, 2009. 注意事項 VidTIMITデータセットは合計44個のファイルから構成され、全体で約3GBの容量を占めています。各zipファイルの平均サイズは71MBです。一度に1つのファイルのみをダウンロードしてください。これはサーバーに過負荷がかからないようにするためです。

No content available at the moment

Share your thoughts

Go share your ideas~~

ALL

Welcome to exchange and share

Your sharing can help others better utilize data.

Data usage instructions:

I. Data Source and Display Explanation:

1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.

2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.

3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.

II. Ownership Explanation:

1. All datasets on this site are copyrighted by their original publishers or data providers.

III. Data Reposting Explanation:

1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.

IV. Infringement and Handling Explanation:

1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.

Points：

0 Go earn points？

637
4
0
collect
Share

Select Language

AI Technology Community

Today search ranking

month_search_ranking

Dataset Category

Open Dataset

VidTIMIT 音声ビデオデータセット

Data Structure ? 3088.22M

Data Structure ?

*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

README.md

Similar Data

The dataset is currently being organized and other channels have been prepared for you. Please use them

The dataset is currently being organized and other channels have been prepared for you. Please use them

ALL

I. Data Source and Display Explanation:

II. Ownership Explanation:

III. Data Reposting Explanation:

IV. Infringement and Handling Explanation: