Select Language

Open Dataset

CN - Celeb:屋外で収集された大規模な話者識別データセット これは「自然環境下」で収集された大規模な話者認識データセットです。このデータセットは2つのサブセットから構成されています。...Common Audio
29.66G 1540
アラビア自然音声データセット これは、3種類の離散的感情(喜び、怒り、驚き)を識別するための最初のアラビア語の自然音声データセット(ANAD)です。オンラインのアラビア語トークショー番組から、スタジオ外の音声をダウンロードしました。...Music Analysis Audio
1.4G 705
無料 ST アメリカ英語コーパス このコーパスは、屋内の静かな環境で携帯電話を使って録音されました。10人の話者がいます。各話者には約350の発話があります。全ての発話……...Music Analysis Audio
351M 814
無料ST中国語普通話コーパス このコーパスは、屋内の静かな環境で携帯電話を使って録音されました。855人の話者がいます。各話者には120発話があります。すべての発話...Music Analysis Audio
8.2G 1084
英国中部女性録音データセット このデータセットには、さまざまな方言を話すボランティアによって録音された英語の文章の高品質な文字起こし音声が含まれています。...Music Analysis Audio
103M 824
アイルランド男性の録音データセット このデータセットには、さまざまな方言を話すボランティアが録音した英語の文章の高品質な文字起こし済みオーディオが含まれています...Music Analysis Audio
164M 744
深度韓国語読み上げ音声コーパス このリソースについて:収録環境:スタジオアパート(適度な残響)、ダンススタジオ(高い残響)、無響室...Music Analysis Audio
281M 857
Kazakh Speech Corpus (KSC) カザフ語コーパス(KSC) カザフ語用のクラウドソーシングによるオープンソース音声コーパス。KSCには約332時間の文字起こしされた音声が含まれています。...Music Analysis Audio
19G 1400
トルステン・ミュラー(ドイツ感情 - TTSデータセット) 私は、すべての人が平等な世界を信じる一人として、自分の個人的な声を寄せます。性別に関係なく、……...Music Analysis Audio
399M 769
Hi-Fi多スピーカー英語TTSデータセット (Hi-Fi TTS) テキストから音声へのモデルを訓練するための多話者英語データセットこのリソースについて:Hi-Fi多話者英語TTSデータセット(Hi-Fi TTS)は、m...Music Analysis Audio
41G 811
Nonverbal Vocalization Dataset 深度非言語発声データセット このリソースについて:ボリューム(全セット):約0.6(約57)時間、約800(約70,000)発話、約500(約1500)話者 形式:16kHz、16ビット...Music Analysis Audio
43.7M 798
LibriSpeech ASRコーパス音声データ LibriSpeech ASRコーパスは音声データで、1000時間の英語の発音と対応する文字が含まれています。識別子:SLR12要約:大規模(1000時間)の朗読英語...NLP Audio
8.14G 1335
Google Audiosetオーディオデータセット AudioSetには632種類のオーディオカテゴリと、2084320本の10秒間の長さの人工的にラベル付けされた音声クリップ(クリップはYouTube動画から取得)が含まれています。オーディオ本体...NLP Audio
2.41G 1747
THUYG - 20 ウイグル語音声データ 要約:無料のウイグル語データベースはCSLT @清華大学と新疆大学によって公開されました。カテゴリ:講演。ライセンス:Apache License v.2.0。紹介:THUGY20は音声と語...NLP Audio
6.12G 1606
ALFFAアフリカ音声データ サハラ以南アフリカの言語資源を収集して自動音声認識を行う:ウォロフ語の事例研究。エロディ・ゴーチエ、ローラン・ベサシエ、シルヴィ・ヴォアン、マイケル・メル...NLP Audio
3.81G 800
THCHS - 30 中国語音声認識データ THCHS - 30識別子:SLR18要約:CSLT @清華大学が無料の中国語音声コーパスを公開カテゴリ:講演ライセンス:Apache License v.2.0THCHS30は清華大学によって...NLP Audio
13.4G 1475
シンハラ語の音声合成(TTS)音声認識データ 僧伽羅語TTS識別子:SLR30要約:僧伽羅語マルチスピーカーTTSコーパスカテゴリ:スピーチ許可:表示 - 継承 4.0国際(CC BY - SA 4.0)このリソースについて...CNN Audio
247.96M 1057
呼吸音データセット、呼吸器系疾患の検出に使用 呼吸音データベースは、録音を使用して呼吸器系疾患を検出します。呼吸音は、呼吸の健康状態と呼吸器系疾患の重要な指標です。人が呼吸する際に発する音は、空気の流れや肺組織と関係があります。...Medical Audio
3.69G 1489
心拍音データセット このデータセットは当初、機械学習の課題として心臓の鼓動音を分類するために作成されました。データは2つのソースから収集されました:(A)iStethoscope Pro iPhoneアプリケーションを通じて...Medical Audio
110M 840
TED-LIUM英語音声認識訓練コーパス TIMIT読み上げ音声コーパスは、音声研究および自動音声認識システムの開発と評価のために音声データを提供することを目的としています。TIMITには、米国の630人の人々の広帯域録音が含まれています。...Video Games Audio
19.82G 679