Select Language

Open Dataset

アラビア自然音声データセット

アラビア自然音声データセット

1.4G
705 hits
0 likes
2 downloads
0 discuss
Music Analysis Audio

これは、3種類の離散的感情(喜び、怒り、驚き)を識別するための最初のアラビア語の自然音声データセット(ANAD)です。オンラインのアラビア語トークショー番組から、スタジオ外の音声をダウンロードしました。......

Data Structure ? 1.4G

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    これは、3種類の離散的な感情(喜び、怒り、驚き)を識別するための最初のアラビア語の自然音声データセット(ANAD)です。

    オンラインのアラビア語トークショー番組から、スタジオ外で司会者と人間とのリアルタイム通話のビデオを8つダウンロードしました。その後、各ビデオを発話単位(発信者と受信者)に分割しました。各ビデオにラベルを付けるために、18人の聴取者に各ビデオを聴いてもらい、喜び、怒り、または驚きの感情を感じたかどうかを選択させました。無音部分、笑い声、およびノイズの多い部分を除去しました。そして、各ブロックを自動的に1秒の音声単位に分割し、1384個のレコードからなる最終コーパスを形成しました。

    25個の音響特徴(低レベル記述子とも呼ばれます)を抽出しました。これらの特徴には、強度、ゼロ交差率、MFCC 1 - 12(メル周波数ケプストラム係数)、F0(基本周波数)とF0エンベロープ、有声化の確率、およびLSP周波数0 - 7が含まれます。各特徴に対して19個の統計関数を適用しました。関数には、最大値、最小値、範囲、最大値の絶対位置、最小値の絶対位置、算術平均、線形回帰1、線形回帰2、線形回帰A、線形回帰Q、標準偏差、尖度、歪度、四分位数1、2、3、および四分位範囲1 - 2、2 - 3、1 - 3が含まれます。各低レベル記述子の差分係数も、1次導関数の推定値として計算され、合計で950個の特徴が得られます。

    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:15 Go earn points?
    • 705
    • 2
    • 0
    • collect
    • Share