Select Language

Open Dataset

会話英語オーディオ注釈

会話英語オーディオ注釈

3.9M
344 hits
0 likes
1 downloads
0 discuss
Music,Audio Data Classification

文脈付き固有表現認識(NER)は主に書面テキストの文脈の中で研究されています。具体的には、NERは医療記録の匿名化(de-ID)における重要なステップであり、その中では多くの......

Data Structure ? 3.9M

    README.md

    コンテキスト付き固有表現抽出(NER)は主に書面テキストのコンテキストで研究されています。具体的には、NERは医療記録の匿名化(de - ID)の重要なステップであり、多くの記録は患者と医師の会話です。このような録音では、個人情報を含む音声区間は、書面テキストのde - IDにおける敏感な文字区間の編集と同様に編集する必要があります。当社のNAACL 2019論文「[Audio De identification:A New Entity Recognition Task][1]」では、このデータセットを音声識別パイプラインの性能テストに使用しました。当社は、英会話を含むSwitchboard(LDC2001S13)およびFisher(LDC2004S13)データセットの会話のランダムなサブセットを使用してパイプラインを評価しました。内容として、当社はNERラベル、音声区間時間、会話ID、およびソースデータセットで構成される音声注釈を使用してファイルを手動で注釈付けしました。このデータセットには、CC BY 4.0ライセンスファイル、3つのデータファイル、および付加的なコンテキストと説明が記載されたREADMEファイルが含まれています。

    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:10 Go earn points?
    • 344
    • 1
    • 0
    • collect
    • Share