Related Search
您是不是在找?
Today ranking
Weekly Best Sellers
Monthly Best Sellers
複数の地物セグメントを追跡するビデオセグメンテーションデータセット
セグメントプール追跡は、我々がビデオセグメンテーション問題に対して提示したフレームワークです。上の図は、...Deep Learning Classification
199.52M
814
Fuxin Li, Taeyoung Kim
Deepfake検出チャレンジ、顔または音声操作を通じて動画を識別する
データ量は高達472GBで、119,197個のビデオを含んでいます。各ビデオの長さはすべて10秒ですが、フレームレートは15~30fpsまで様々で、解像度も320×240~3840×2160までです。...Person,Face 2D Box
471.84G
838
kaggle
CN - Celeb:屋外で収集された大規模な話者識別データセット
これは「自然環境下」で収集された大規模な話者認識データセットです。このデータセットは2つのサブセットから構成されています。...Common Audio
29.66G
1540
openslr
アラビア自然音声データセット
これは、3種類の離散的感情(喜び、怒り、驚き)を識別するための最初のアラビア語の自然音声データセット(ANAD)です。オンラインのアラビア語トークショー番組から、スタジオ外の音声をダウンロードしました。...Music Analysis Audio
1.4G
705
Samira klaylat
オランダ語モノラル音声データセット、CSS10オランダ語:モノラル音声データセット
CSS10は10の言語に対応した単一話者の音声データセットのコレクションです。それぞれは録音された音声ファイルで構成されています...Data Cleaning,Universities and Colleges Classification
2.01G
596
Kyubyong Park
MAGICDATA中国語(普通話)朗読コーパスデータベース(テストデータセット)
MAGICDATA中国語標準語読み上げ音声コーパスは、MAGIC DATATechnology Co., Ltd.によって開発され、無料で公開されています...Music Analysis Audio
2.2G
1303
imagicdatatech
MAGICDATA中国語北京語朗読コーパスデータベース(訓練データセット)
MAGICDATA中国語読み上げ音声コーパスは、MAGIC DATAテクノロジー株式会社によって開発され、無料で公開されています。...Music Analysis Audio
52G
1128
imagicdatatech
Primewords中国語標準語コーパスは、100時間の音声データを含んでいます。
この無料の中国語(マンダリン)音声コーパスセットは、上海普强信息技术有限公司によって公開されました。...Music Analysis Audio
9G
1534
primewords
無料 ST アメリカ英語コーパス
このコーパスは、屋内の静かな環境で携帯電話を使って録音されました。10人の話者がいます。各話者には約350の発話があります。全ての発話……...Music Analysis Audio
351M
814
surfing.ai
無料ST中国語普通話コーパス
このコーパスは、屋内の静かな環境で携帯電話を使って録音されました。855人の話者がいます。各話者には120発話があります。すべての発話...Music Analysis Audio
8.2G
1084
surfing.ai
英国中部女性録音データセット
このデータセットには、さまざまな方言を話すボランティアによって録音された英語の文章の高品質な文字起こし音声が含まれています。...Music Analysis Audio
103M
824
Google, Inc.
アイルランド男性の録音データセット
このデータセットには、さまざまな方言を話すボランティアが録音した英語の文章の高品質な文字起こし済みオーディオが含まれています...Music Analysis Audio
164M
744
Google, Inc.
高品質なヨルバ語音声データセット(女性音声)
このデータセットには、ボランティアによって録音されたヨルバ語の文章の高品質な音声の文字起こしが含まれています。このデータセットは...Music Analysis Audio
462M
762
Google, Inc.
高品質のヨルバ語音声データセット(男性の声)
このデータセットには、ボランティアによって収録されたヨルバ語の文章の高品質な音声文字起こしデータが含まれています。このデータセットは...Music Analysis Audio
445M
952
Google, Inc.
281M
857
Deeply Inc
Kazakh Speech Corpus (KSC) カザフ語コーパス(KSC)
カザフ語用のクラウドソーシングによるオープンソース音声コーパス。KSCには約332時間の文字起こしされた音声が含まれています。...Music Analysis Audio
19G
1400
NET
トルステン・ミュラー(ドイツ感情 - TTSデータセット)
私は、すべての人が平等な世界を信じる一人として、自分の個人的な声を寄せます。性別に関係なく、……...Music Analysis Audio
399M
769
Thorsten Müller
Hi-Fi多スピーカー英語TTSデータセット (Hi-Fi TTS)
テキストから音声へのモデルを訓練するための多話者英語データセットこのリソースについて:Hi-Fi多話者英語TTSデータセット(Hi-Fi TTS)は、m...Music Analysis Audio
41G
811
LibriVox
Nonverbal Vocalization Dataset 深度非言語発声データセット
このリソースについて:ボリューム(全セット):約0.6(約57)時間、約800(約70,000)発話、約500(約1500)話者 形式:16kHz、16ビット...Music Analysis Audio
43.7M
798
Deeply Inc
ダイムラー 歩行者分類基準データセット
データセットは歩行者と非歩行者の画像集合を含んでいます。ベンチマークテストを行うために、このサイトでこのファイルをダウンロードして、歩行者分類の研究を推進することができます。データセットは2つの部分で構成されています。...Autonomous Driving Audio
399M
846
CVPR