Related Search
您是不是在找?
Today ranking
Weekly Best Sellers
Monthly Best Sellers
ダイムラー歩道予測基準データセット(ECCV'14)
このページでは、ダイムラーの歩道予測ベンチマークデータセットJFP Kooij, N. Schneider, F. FlohrおよびD. M. Gavrilaについて紹介しています。コンテキストに基づく歩行者の経路予測。欧州会議...Environment,Vehicle,Environment Audio
2.45M
778
Daimler
LibriSpeech ASRコーパス音声データ
LibriSpeech ASRコーパスは音声データで、1000時間の英語の発音と対応する文字が含まれています。識別子:SLR12要約:大規模(1000時間)の朗読英語...NLP Audio
8.14G
1335
Vassil Panayotov
Google Audiosetオーディオデータセット
AudioSetには632種類のオーディオカテゴリと、2084320本の10秒間の長さの人工的にラベル付けされた音声クリップ(クリップはYouTube動画から取得)が含まれています。オーディオ本体...NLP Audio
2.41G
1747
Google
THUYG - 20 ウイグル語音声データ
要約:無料のウイグル語データベースはCSLT @清華大学と新疆大学によって公開されました。カテゴリ:講演。ライセンス:Apache License v.2.0。紹介:THUGY20は音声と語...NLP Audio
6.12G
1606
清华大学
ALFFAアフリカ音声データ
サハラ以南アフリカの言語資源を収集して自動音声認識を行う:ウォロフ語の事例研究。エロディ・ゴーチエ、ローラン・ベサシエ、シルヴィ・ヴォアン、マイケル・メル...NLP Audio
3.81G
800
ALFFA
THCHS - 30 中国語音声認識データ
THCHS - 30識別子:SLR18要約:CSLT @清華大学が無料の中国語音声コーパスを公開カテゴリ:講演ライセンス:Apache License v.2.0THCHS30は清華大学によって...NLP Audio
13.4G
1475
Tsinghua University
シンハラ語の音声合成(TTS)音声認識データ
僧伽羅語TTS識別子:SLR30要約:僧伽羅語マルチスピーカーTTSコーパスカテゴリ:スピーチ許可:表示 - 継承 4.0国際(CC BY - SA 4.0)このリソースについて...CNN Audio
247.96M
1057
Google
呼吸音データセット、呼吸器系疾患の検出に使用
呼吸音データベースは、録音を使用して呼吸器系疾患を検出します。呼吸音は、呼吸の健康状態と呼吸器系疾患の重要な指標です。人が呼吸する際に発する音は、空気の流れや肺組織と関係があります。...Medical Audio
3.69G
1489
voltamax
心拍音データセット
このデータセットは当初、機械学習の課題として心臓の鼓動音を分類するために作成されました。データは2つのソースから収集されました:(A)iStethoscope Pro iPhoneアプリケーションを通じて...Medical Audio
110M
840
Ed King
数千種類の一般的な医学的症状に関する音声データセット、録音時間は8.5時間を超える
このデータには、「膝の痛み」や「頭痛」など、数千種類の一般的な医学的症状に関する音声が含まれており、合計で 8 時間以上に及びます。各音声は、個人の貢献者によって提供されています。...Audio Data Audio
2.63G
1063
appen
スワヒリ語翻訳音声トランスクリプションとテーマ(10 個の 1 時間半の音声データセットを含む)
このタスクの入力データは、赤十字社からの災害と脅威に関する情報であり、その中には疾病、人身傷害、自然災害などの主題が含まれています。各カテゴリには関連情報が提供されています。...Video Data Audio
42.8G
721
appen
TED-LIUM英語音声認識訓練コーパス
TIMIT読み上げ音声コーパスは、音声研究および自動音声認識システムの開発と評価のために音声データを提供することを目的としています。TIMITには、米国の630人の人々の広帯域録音が含まれています。...Video Games Audio
19.82G
679
University of Pennsylvania
無料ST中国語(普通話)コーパス
このコーパスは、室内の静音環境で携帯電話を使って収録されました。このコーパスには855人の話者がいます。各話者には120発話があります。すべての発話は慎重に収録され、人手でチェックされました。文字起こし...Music Analysis Audio
8.2G
637
openslr
LibriTTSコーパス
LibriTTSは多言語英語コーパスで、Heiga ZenがGoogle SpeechとGoogle Brainチームの支援を受けて作成したもので、24kHzのサンプリングレートで約585時間の英語の読み上げ音声が収録されています。...Video Data Audio
1.2G
1793
openslr
無料STアメリカ英語コーパス
このコーパスは、室内の静音環境で携帯電話を使って収録されました。これには10人の話者がいます。各話者には約350種類の発話があります。すべての発話は慎重に収録され、人手でチェックされています。...Video Games Audio
351M
629
openslr
THCHS30中国語音声データセット
THCHS30はオープンな中国語音声データベースで、清華大学音声と言語技術センター(CSLT)によって公開されました。元の記録は2002年に王冬が清華大学のコンピューター科学において...Music Analysis Audio
6.4G
1181
清华大学语音与语言技术中心
呼吸音データセット、920本の注釈付き音声データを含む
呼吸音は呼吸の健康状態や呼吸器系疾患の重要な指標です。人が呼吸する際に発する音は、空気の流れ、肺組織内の変化、および肺内の分泌物の位置と直接関係しています。例えば...Medical Classification
3.69G
1160
robot
人間の音声の大規模な視聴覚データセット (VoxCeleb2)
VoxCeleb2は、YouTubeにアップロードされた動画から抽出された6,112人の有名人の100万以上の発話を含んでいます。VoxCeleb2の開発セットは、VoxCeleb1またはSITW...Music Analysis Audio
1.47G
1837
robot
大型話者識別データセット(VoxCeleb1)
VoxCeleb1には、YouTubeにアップロードされた動画から抽出された1,251人の有名人の10万以上の発話が含まれています。...Music Analysis Audio
136M
816
robot