Open Dataset

DARPA TIMIT音響音声連続音声

1198.1M

284 hits

0 likes

1 downloads

0 discuss

NLP,Audio Data Classification

#DARPA TIMIT音響音声連続音声コーパス-**特に感謝**：**https://github.com/philipperemy/timit/edit/master/README.md**-**ダウンロード**......

Introduction
Data file
Related papers
Code
Discuss(0)
Instructions

Data Structure ? 1198.1M

README.md

#DARPA TIMIT音響音声連続音声コーパス - **特別な感謝**：**https://github.com/philipperemy/timit/edit/master/README.md** - **ダウンロードリンク（無料、Academy Torrents提供）**：**https://goo.gl/l0sPwz** - **タイプ**：データセット - **概要**：DARPA TIMIT音響音声連続音声コーパス（TIMIT）の訓練およびテストデータ。TIMIT朗読音声コーパスは、音響音声知識の獲得、自動音声認識システムの開発と評価のための音声データを提供することを目的としています。TIMITは、国防高等研究計画局 - 情報科学技術局（DARPA - ISTO）の後援の下、複数のサイトが共同で努力した成果です。テキストコーパスの設計は、マサチューセッツ工科大学（MIT）、スタンフォード研究所（SRI）、テキサス・インスツルメンツ（TI）の共同努力です。講演はTIで録音され、MITで文字起こしされ、米国国立標準技術研究所（NIST）によって保存、検証され、CD - ROM制作のために準備されました。この文書には、TIMIT音声コーパスの簡単な説明が含まれています。他の情報、参考資料や関連記事の再版などは、印刷文書に記載されており、これはNTIS（NTIS#PB91 - 100354）からも入手できます。コーパス話者分布TIMITには合計6300の文が含まれており、米国の8つの主要な方言圏から選ばれた630人の話者がそれぞれ10文を発話しています。表1には、性別別に8つの方言圏の話者数が示されています。括弧内にはパーセンテージが記載されています。話者の方言圏は、彼らが子供の頃に生活していた米国の地理的地域です。地理的地域は、米国で認められている方言圏に対応しています（オハイオ州立大学言語学系言語アーカイブ、1982年）が、西部地域（dr7）を除き、西部地域では方言の境界が不明であり、方言圏8の使用者は子供の頃に頻繁に移動していました。表1：話者の方言分布方言圏（dr） #男性 #女性合計---------------------------------------------1 31（63%） 18（27%） 49（8%）2 71（70%） 31（30%） 102（16%）3 79（67%） 23（23%） 102（16%）4 69（69%） 31（31%） 100（16%）5 62（63%） 36（37%） 98（16%）6 30（65%） 16（35%） 46（7%）7 74（74%） 26（26%） 100（16%）8 22（67%） 11（33%） 33（5%）--------------------------------------------合計 438（70%） 192（30%） 630（100%）方言圏は以下の通りです：dr1：ニューイングランドdr2：北部dr3：北ミッドランドdr4：南ミッドランドdr5：南部dr6：ニューヨーク市dr7：西部dr8:Army Brat（移動頻繁）#コーパステキスト材料TIMITのプロンプト内のテキスト材料（ファイル「prompts.doc」に記載）は、SRIが設計した2つの方言「シボレス」文、MITが設計した450の音声コンパクトな文、TIが選んだ1890の音声多様な文から構成されています。方言文（SA文）は、話者の方言バリエーションを明らかにすることを目的としており、全630人の話者が読み上げます。音声コンパクトな文は、対の音素をうまくカバーするように設計されており、追加で現れる音声コンテキストは困難または特に興味深いと考えられています。各話者はそのうちの5文を読み上げ（SX文）、各テキストは7人の異なる話者によって読み上げられます。音声多様性の文（SI文）は、既存のテキストソース - ブラウンコーパス（KucheraとFrancis、1967）と劇作家の対話（Hultzenら、1964） - から選ばれており、文の種類と音声コンテキストの多様性を増やすためです。選択基準は、テキスト内の様々な異音背景を最大化しています。各話者はそのうちの3文を読み上げ、各文は1人の話者によってのみ読み上げられます。表2は、TIMIT内の講演材料をまとめたものです。表2:TIMIT講演材料文の種類 #文 #話者合計 #文/話者---------------------------------------------方言（SA） 2 630 1260 2コンパクト（SX） 450 7 3150 5多様（SI） 1890 1 1890 3-------------------------------------------------------------合計 2342 6300 10推奨訓練/テスト細分講演材料は、訓練部分とテスト部分に細分されています。細分の基準は、ファイル「testset.doc」に記載されています。この細分は、CD - ROMのプロトタイプ版に配布されているデータとは無関係です。#コアテストセット：テストデータには、各方言から2人の男性と1人の女性の合計24人の話者を含むコア部分があります。

No content available at the moment

Share your thoughts

Go share your ideas~~

ALL

Welcome to exchange and share

Your sharing can help others better utilize data.

Data usage instructions:

I. Data Source and Display Explanation:

1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.

2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.

3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.

II. Ownership Explanation:

1. All datasets on this site are copyrighted by their original publishers or data providers.

III. Data Reposting Explanation:

1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.

IV. Infringement and Handling Explanation:

1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.

Points：

15 Go earn points？

284
1
0
collect
Share

Select Language

AI Technology Community

Today search ranking

month_search_ranking

Dataset Category

Open Dataset

DARPA TIMIT音響音声連続音声

Data Structure ? 1198.1M

README.md

Similar Data

ALL

I. Data Source and Display Explanation:

II. Ownership Explanation:

III. Data Reposting Explanation:

IV. Infringement and Handling Explanation: