Select Language

Open Dataset

DARPA TIMIT音響音声連続音声

DARPA TIMIT音響音声連続音声

1198.1M
275 hits
0 likes
1 downloads
0 discuss
NLP,Audio Data Classification

#DARPA TIMIT音響音声連続音声コーパス-**特に感謝**:**https://github.com/philipperemy/timit/edit/master/README.md**-**ダウンロード**......

Data Structure ? 1198.1M

    README.md

    #DARPA TIMIT音響音声連続音声コーパス - **特別な感謝**:**https://github.com/philipperemy/timit/edit/master/README.md** - **ダウンロードリンク(無料、Academy Torrents提供)**:**https://goo.gl/l0sPwz** - **タイプ**:データセット - **概要**:DARPA TIMIT音響音声連続音声コーパス(TIMIT)の訓練およびテストデータ。TIMIT朗読音声コーパスは、音響音声知識の獲得、自動音声認識システムの開発と評価のための音声データを提供することを目的としています。TIMITは、国防高等研究計画局 - 情報科学技術局(DARPA - ISTO)の後援の下、複数のサイトが共同で努力した成果です。テキストコーパスの設計は、マサチューセッツ工科大学(MIT)、スタンフォード研究所(SRI)、テキサス・インスツルメンツ(TI)の共同努力です。講演はTIで録音され、MITで文字起こしされ、米国国立標準技術研究所(NIST)によって保存、検証され、CD - ROM制作のために準備されました。この文書には、TIMIT音声コーパスの簡単な説明が含まれています。他の情報、参考資料や関連記事の再版などは、印刷文書に記載されており、これはNTIS(NTIS#PB91 - 100354)からも入手できます。コーパス話者分布TIMITには合計6300の文が含まれており、米国の8つの主要な方言圏から選ばれた630人の話者がそれぞれ10文を発話しています。表1には、性別別に8つの方言圏の話者数が示されています。括弧内にはパーセンテージが記載されています。話者の方言圏は、彼らが子供の頃に生活していた米国の地理的地域です。地理的地域は、米国で認められている方言圏に対応しています(オハイオ州立大学言語学系言語アーカイブ、1982年)が、西部地域(dr7)を除き、西部地域では方言の境界が不明であり、方言圏8の使用者は子供の頃に頻繁に移動していました。表1:話者の方言分布方言圏(dr) #男性 #女性 合計---------------------------------------------1 31(63%) 18(27%) 49(8%)2 71(70%) 31(30%) 102(16%)3 79(67%) 23(23%) 102(16%)4 69(69%) 31(31%) 100(16%)5 62(63%) 36(37%) 98(16%)6 30(65%) 16(35%) 46(7%)7 74(74%) 26(26%) 100(16%)8 22(67%) 11(33%) 33(5%)--------------------------------------------合計 438(70%) 192(30%) 630(100%)方言圏は以下の通りです:dr1:ニューイングランドdr2:北部dr3:北ミッドランドdr4:南ミッドランドdr5:南部dr6:ニューヨーク市dr7:西部dr8:Army Brat(移動頻繁)#コーパステキスト材料TIMITのプロンプト内のテキスト材料(ファイル「prompts.doc」に記載)は、SRIが設計した2つの方言「シボレス」文、MITが設計した450の音声コンパクトな文、TIが選んだ1890の音声多様な文から構成されています。方言文(SA文)は、話者の方言バリエーションを明らかにすることを目的としており、全630人の話者が読み上げます。音声コンパクトな文は、対の音素をうまくカバーするように設計されており、追加で現れる音声コンテキストは困難または特に興味深いと考えられています。各話者はそのうちの5文を読み上げ(SX文)、各テキストは7人の異なる話者によって読み上げられます。音声多様性の文(SI文)は、既存のテキストソース - ブラウンコーパス(KucheraとFrancis、1967)と劇作家の対話(Hultzenら、1964) - から選ばれており、文の種類と音声コンテキストの多様性を増やすためです。選択基準は、テキスト内の様々な異音背景を最大化しています。各話者はそのうちの3文を読み上げ、各文は1人の話者によってのみ読み上げられます。表2は、TIMIT内の講演材料をまとめたものです。表2:TIMIT講演材料文の種類 #文 #話者合計 #文/話者---------------------------------------------方言(SA) 2 630 1260 2コンパクト(SX) 450 7 3150 5多様(SI) 1890 1 1890 3-------------------------------------------------------------合計 2342 6300 10推奨訓練/テスト細分講演材料は、訓練部分とテスト部分に細分されています。細分の基準は、ファイル「testset.doc」に記載されています。この細分は、CD - ROMのプロトタイプ版に配布されているデータとは無関係です。#コアテストセット:テストデータには、各方言から2人の男性と1人の女性の合計24人の話者を含むコア部分があります。


    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:15 Go earn points?
    • 275
    • 1
    • 0
    • collect
    • Share