声_Open DatasetPayititi-Artificial Intelligence Data Science Community

ダイムラー歩道予測基準データセット（ECCV'14）このページでは、ダイムラーの歩道予測ベンチマークデータセットJFP Kooij, N. Schneider, F. FlohrおよびD. M. Gavrilaについて紹介しています。コンテキストに基づく歩行者の経路予測。欧州会議...Environment,Vehicle,Environment Audio

2.45M 791

Daimler

LibriSpeech ASRコーパス音声データ LibriSpeech ASRコーパスは音声データで、1000時間の英語の発音と対応する文字が含まれています。識別子：SLR12要約：大規模（1000時間）の朗読英語...NLP Audio

8.14G 1341

Vassil Panayotov

Google Audiosetオーディオデータセット AudioSetには632種類のオーディオカテゴリと、2084320本の10秒間の長さの人工的にラベル付けされた音声クリップ（クリップはYouTube動画から取得）が含まれています。オーディオ本体...NLP Audio

2.41G 1753

Google

THUYG - 20 ウイグル語音声データ要約：無料のウイグル語データベースはCSLT @清華大学と新疆大学によって公開されました。カテゴリ：講演。ライセンス：Apache License v.2.0。紹介：THUGY20は音声と語...NLP Audio

6.12G 1614

清华大学

ALFFAアフリカ音声データサハラ以南アフリカの言語資源を収集して自動音声認識を行う：ウォロフ語の事例研究。エロディ・ゴーチエ、ローラン・ベサシエ、シルヴィ・ヴォアン、マイケル・メル...NLP Audio

3.81G 809

ALFFA

THCHS - 30 中国語音声認識データ THCHS - 30識別子：SLR18要約：CSLT @清華大学が無料の中国語音声コーパスを公開カテゴリ：講演ライセンス：Apache License v.2.0THCHS30は清華大学によって...NLP Audio

13.4G 1484

Tsinghua University

シンハラ語の音声合成（TTS）音声認識データ僧伽羅語TTS識別子：SLR30要約：僧伽羅語マルチスピーカーTTSコーパスカテゴリ：スピーチ許可：表示 - 継承 4.0国際（CC BY - SA 4.0）このリソースについて...CNN Audio

247.96M 1066

Google

呼吸音データセット、呼吸器系疾患の検出に使用呼吸音データベースは、録音を使用して呼吸器系疾患を検出します。呼吸音は、呼吸の健康状態と呼吸器系疾患の重要な指標です。人が呼吸する際に発する音は、空気の流れや肺組織と関係があります。...Medical Audio

3.69G 1497

voltamax

心拍音データセットこのデータセットは当初、機械学習の課題として心臓の鼓動音を分類するために作成されました。データは2つのソースから収集されました：（A）iStethoscope Pro iPhoneアプリケーションを通じて...Medical Audio

110M 843

Ed King

数千種類の一般的な医学的症状に関する音声データセット、録音時間は8.5時間を超えるこのデータには、「膝の痛み」や「頭痛」など、数千種類の一般的な医学的症状に関する音声が含まれており、合計で 8 時間以上に及びます。各音声は、個人の貢献者によって提供されています。...Audio Data Audio

2.63G 1083

appen

スワヒリ語翻訳音声トランスクリプションとテーマ（10 個の 1 時間半の音声データセットを含む）このタスクの入力データは、赤十字社からの災害と脅威に関する情報であり、その中には疾病、人身傷害、自然災害などの主題が含まれています。各カテゴリには関連情報が提供されています。...Video Data Audio

42.8G 730

appen

TED-LIUM英語音声認識訓練コーパス TIMIT読み上げ音声コーパスは、音声研究および自動音声認識システムの開発と評価のために音声データを提供することを目的としています。TIMITには、米国の630人の人々の広帯域録音が含まれています。...Video Games Audio

19.82G 686

University of Pennsylvania

無料ST中国語（普通話）コーパスこのコーパスは、室内の静音環境で携帯電話を使って収録されました。このコーパスには855人の話者がいます。各話者には120発話があります。すべての発話は慎重に収録され、人手でチェックされました。文字起こし...Music Analysis Audio

8.2G 642

openslr

LibriTTSコーパス LibriTTSは多言語英語コーパスで、Heiga ZenがGoogle SpeechとGoogle Brainチームの支援を受けて作成したもので、24kHzのサンプリングレートで約585時間の英語の読み上げ音声が収録されています。...Video Data Audio

1.2G 1802

openslr

無料STアメリカ英語コーパスこのコーパスは、室内の静音環境で携帯電話を使って収録されました。これには10人の話者がいます。各話者には約350種類の発話があります。すべての発話は慎重に収録され、人手でチェックされています。...Video Games Audio

351M 635

openslr

THCHS30中国語音声データセット THCHS30はオープンな中国語音声データベースで、清華大学音声と言語技術センター（CSLT）によって公開されました。元の記録は2002年に王冬が清華大学のコンピューター科学において...Music Analysis Audio

6.4G 1194

清华大学语音与语言技术中心

呼吸音データセット、920本の注釈付き音声データを含む呼吸音は呼吸の健康状態や呼吸器系疾患の重要な指標です。人が呼吸する際に発する音は、空気の流れ、肺組織内の変化、および肺内の分泌物の位置と直接関係しています。例えば...Medical Classification

3.69G 1173

robot

人間の音声の大規模な視聴覚データセット（VoxCeleb2） VoxCeleb2は、YouTubeにアップロードされた動画から抽出された6,112人の有名人の100万以上の発話を含んでいます。VoxCeleb2の開発セットは、VoxCeleb1またはSITW...Music Analysis Audio

1.47G 1845

robot

大型話者識別データセット（VoxCeleb1） VoxCeleb1には、YouTubeにアップロードされた動画から抽出された1,251人の有名人の10万以上の発話が含まれています。...Music Analysis Audio

136M 824

robot

FMA大型音楽分析データセット Music Analysis Audio

1000G 756

robot

Select Language

AI Technology Community

Today search ranking

month_search_ranking

Dataset Category

Open Dataset