Select Language

Open Dataset

CN - Celeb:屋外で収集された大規模な話者識別データセット

CN - Celeb:屋外で収集された大規模な話者識別データセット

29.66G
1540 hits
0 likes
5 downloads
0 discuss
Common Audio

これは「自然環境下」で収集された大規模な話者認識データセットです。このデータセットは2つのサブセットから構成されています。......

Data Structure ? 29.66G

    README.md

    これは「自然環境」で収集された大規模な話者認識データセットです。このデータセットは、CN - Celeb1とCN - Celeb2の2つのサブセットから構成されています。すべての音声ファイルは、単チャンネルでコード化され、16kHzでサンプリングされ、16ビット精度で記録されています。 CN - Celeb1には、1000人の中国の著名人による13万以上の発話が含まれており、現実世界の11種類の異なるジャンルをカバーしています。 CN - Celeb2には、2000人の中国の著名人による52万以上の発話が含まれており、現実世界の11種類の異なるジャンルをカバーしています。 データ収集プロセスは、清華大学の音声言語技術研究センターによって組織されました。また、中国国家自然科学基金(No. 61633013)と中国博士後期研究員科学基金(No. 2018M640133)による資金提供を受けています。 次のBibTeXエントリを使用してこのデータを引用することができます:

    @misc{fan2019cnceleb,
      title={CN - CELEB: 挑戦的な中国語話者認識データセット},
      author={Yue Fan と Jiawen Kang と Lantian Li と Kaicheng Li と Haolin Chen と Sitong Cheng と Pengyuan Zhang と Ziya Zhou と Yunqi Cai と Dong Wang},
      year={2019},
      eprint={1911.01799},
      archivePrefix={arXiv},
      primaryClass={eess.AS}
     }

    関係者

    Dong Wang、Yue Fan、Hao Cui、Jiawen Kang、Lantian Li、Kaicheng Li、Haolin Chen、Sitong Cheng、Pengyuan Zhang、Ziya Zhou、Yunqi Cai

    連絡先

    住所: 清華大学音声言語技術研究センターFIT棟1 - 303号室

    ホームページ: http://cslt.org または http://cslt.riit.tsinghua.edu.cn

    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:30 Go earn points?
    • 1540
    • 5
    • 0
    • collect
    • Share