Select Language

Open Dataset

サンタバーバラアメリカ英語会話

サンタバーバラアメリカ英語会話

2080.45M
326 hits
0 likes
2 downloads
0 discuss
Music,Linguistics,Languages Classification

Data Structure ? 2080.45M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    文脈: サンタバーバラアメリカ英語会話コーパスは、米国全土から収集された数百の自然な会話の録音データに基づいています。これらの録音は、様々な地域出身、年齢、職業、民族および社会的背景を持つ人々を代表しています。このコーパスは、人々が日常生活で言語を使う様々な場面を反映しています。会話、うわさ話、議論、仕事での会話、カードゲーム、市議会の会議、販売説明、教室での講義、政治演説、寝る前の物語、説教、結婚式などです。このコーパスは、カリフォルニア大学サンタバーバラ校の談話研究センターによって収集されました。主任はジョン・W・デュボワ(UCSB)、編集委員はウォレス・L・チェイフ(UCSB)、チャールズ・マイヤー(ボストンのマサチューセッツ大学)、サンドラ・A・トンプソン(UCSB)です。 各音声ファイルには、フレーズが音声録音に対してタイムスタンプ付きの文字起こしが添付されています。文字起こし内の個人名、地名、電話番号などは、話者とその知人の匿名性を保護するために変更されており、音声ファイルはこれらの部分が認識できないようにフィルタリングされています。これらのフィルタリングされた部分からは音高情報を回復することができますが、これらの領域の振幅レベルは元の信号に比べて低くなっています。音声データは、2チャンネルのpcmで22050Hzで録音されたMP3形式の音声ファイルで構成されています。 内容: このデータセットには、コーパスの第1部が含まれています。他の3部と追加情報は[こちら](http://www.linguistics.ucsb.edu/research/santa-barbara-corpus#Contents)で見ることができます。このデータセットには以下の情報が含まれています。 * 録音データ: 14個の.mp3形式の録音ファイル * 文字起こし: 14個の録音全てに対する時間合わせされた文字起こしで、[CHAT形式](http://childes.talkbank.org/)で提供されます。 * メタデータ: 話者の人口統計情報と、それぞれの話者がどの録音に登場するかが記載された.csvファイルです。(一部の話者は複数の録音に登場しています。) 謝辞: サンタバーバラコーパスは、カリフォルニア大学サンタバーバラ校の言語学部の研究者によって編纂されました。サンタバーバラコーパスの主任はジョン・W・デュボワで、編集委員のウォレス・L・チェイフ、サンドラ・A・トンプソン(ともにカリフォルニア大学サンタバーバラ校)、およびチャールズ・マイヤー(ボストンのマサチューセッツ大学)と協力しています。第3部と第4部の出版に当たっては、著者はジョン・W・デュボワとロバート・エングレブレットンです。 このコーパスは、[CC BY - ND 3.0 USライセンス](https://creativecommons.org/licenses/by-nd/3.0/us/)の下で配布されています。 着想: * 現在、文字起こしは詳細な文字起こしで、話し言葉の途切れや重なりが含まれています。自然言語処理を使って、これらの情報を含まない大まかな文字起こしに変換することはできますか? * このデータセットの音素レベルで時間合わせされた文字起こしを作成することはできますか?[強制アラインメント](https://www.eleanorchodroff.com/tutorial/kaldi/kaldi-forcedalignment.html)を使うと役立つかもしれません。
    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:0 Go earn points?
    • 326
    • 2
    • 0
    • collect
    • Share