Open Dataset
Data Structure ?
1001.5G
README.md
すべてのトラックのすべてのメタデータと特徴量は、fma_metadata.zip
(342 MiB)に配布されています。
以下の表は、pandasまたはその他のデータ分析ツールで使用できます。
説明については、論文またはusage.ipynb
ノートブックを参照してください。
tracks.csv
:すべての106,574トラックについて、ID、タイトル、アーティスト、ジャンル、タグ、再生回数などのトラックごとのメタデータ。genres.csv
:名前と親(ジャンル階層と上位レベルのジャンルを推測するために使用)を持つすべての163のジャンル。features.csv
:librosaで抽出された一般的な特徴量。echonest.csv
:Echonest(現在はSpotify)によって提供される、13,129トラックのサブセットについてのオーディオ特徴量。
次に、様々なサイズのMP3エンコードオーディオデータがあります:
fma_small.zip
:30秒のトラック8,000本、8つのバランスの取れたジャンル(GTZANライク)(7.2 GiB)fma_medium.zip
:30秒のトラック25,000本、16の不均衡なジャンル(22 GiB)fma_large.zip
:30秒のトラック106,574本、161の不均衡なジャンル(93 GiB)fma_full.zip
:トリミングされていないトラック106,574本、161の不均衡なジャンル(879 GiB)
コード
以下のノートブック、スクリプト、およびモジュールは、このデータセット用に開発されました。
usage.ipynb
:データセットをロードし、それを使って独自のモデルを開発、トレーニング、テストする方法を示します。analysis.ipynb
:メタデータ、データ、および特徴量の探索。 論文で使用される図を作成します。baselines.ipynb
:オーディオと特徴量の両方からのジャンル認識のベースラインモデル。features.py
:オーディオからの特徴量抽出(features.csv
を作成するために使用)。webapi.ipynb
:FMAのWeb APIをクエリします。データセットを更新するために使用できます。creation.ipynb
:データセットの作成(tracks.csv
とgenres.csv
を作成するために使用)。creation.py
:データセットの作成(長時間実行されるデータ収集と処理)。utils.py
:ヘルパー関数とクラス。
- Share your thoughts
ALL
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.