VGG-Sound 大規模視聴覚データセット
VGG-Soundは視聴覚対応データセットであり、YouTubeにアップロードされた動画から抽出された音声ショートムービーで構成されています。引用@InProceedings{Chen20,著者=HonglieC...Music Analysis,Others Audio
21.7M
1590
Honglie Chen