Open Dataset
Data Structure ?
29.66G
README.md
これは「自然環境」で収集された大規模な話者認識データセットです。このデータセットは、CN - Celeb1とCN - Celeb2の2つのサブセットから構成されています。すべての音声ファイルは、単チャンネルでコード化され、16kHzでサンプリングされ、16ビット精度で記録されています。 CN - Celeb1には、1000人の中国の著名人による13万以上の発話が含まれており、現実世界の11種類の異なるジャンルをカバーしています。 CN - Celeb2には、2000人の中国の著名人による52万以上の発話が含まれており、現実世界の11種類の異なるジャンルをカバーしています。 データ収集プロセスは、清華大学の音声言語技術研究センターによって組織されました。また、中国国家自然科学基金(No. 61633013)と中国博士後期研究員科学基金(No. 2018M640133)による資金提供を受けています。 次のBibTeXエントリを使用してこのデータを引用することができます:
@misc{fan2019cnceleb, title={CN - CELEB: 挑戦的な中国語話者認識データセット}, author={Yue Fan と Jiawen Kang と Lantian Li と Kaicheng Li と Haolin Chen と Sitong Cheng と Pengyuan Zhang と Ziya Zhou と Yunqi Cai と Dong Wang}, year={2019}, eprint={1911.01799}, archivePrefix={arXiv}, primaryClass={eess.AS} }
関係者
Dong Wang、Yue Fan、Hao Cui、Jiawen Kang、Lantian Li、Kaicheng Li、Haolin Chen、Sitong Cheng、Pengyuan Zhang、Ziya Zhou、Yunqi Cai
連絡先
Dong Wang: wangdong99@mails.tsinghua.edu.cn
Lantian Li: lilt@cslt.org
Yue Fan: fanyue@cslt.org
Jiawen Kang: kangjw@cslt.org
Zhiyuan Tang: tangzy@cslt.org
住所: 清華大学音声言語技術研究センターFIT棟1 - 303号室
ホームページ: http://cslt.org または http://cslt.riit.tsinghua.edu.cn
- Share your thoughts
ALL
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.