Select Language

Open Dataset

GENIAバイオメディカルイベントデータセット

GENIAバイオメディカルイベントデータセット

2.67M
567 hits
0 likes
10 downloads
0 discuss
NLP,Biology,Text Mining,Medicine Classification

文脈-バイオメディカルテキストには、医療分野の発展に利用できる多くの情報が含まれています。従来......

Data Structure ? 2.67M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    背景

    バイオメディカルテキストには、医療分野の発展に利用できる多くの情報が含まれています。従来、このような情報はドメインの専門家が手作業で抽出していました。この情報抽出作業を自動化することで、この分野の進歩を加速させることができます。
    バイオメディカルイベントのいくつかの利用例を挙げると、薬剤が人に与える影響を示すことができます。また、人の特定の医学的状態を特定するためにも使用できます。
    したがって、バイオメディカルテキストからのイベント抽出を自動化することは非常に有益です。

    内容

    このデータセットは、イベントアノテーション付きGENIAデータセットの簡略版で、TEESにあるバージョンから派生したものです。

    このデータセットは、元のバイオメディカルテキスト、ラベル付けされたトリガーワード、テキスト内のトリガーワードの位置、およびトリガーワードに関連付けられたイベントタイプで構成されています。
    データは3つのセット(訓練データ(8000文以上)、開発データ(約3000文)、テストデータ(約3000文))に分かれています。
    各セットには、「文」、「トリガーワード」、「トリガーワードの位置」、「イベントタイプ」の4つの列があり、それぞれ元のバイオメディカルテキスト、文内のトリガーワード、文内のトリガーワードの位置、およびトリガーワードに関連付けられたイベントタイプを捉えています。

    謝辞

    このデータセットは、イベントアノテーション付きGENIAデータセットの簡略版で、TEESにあるバージョンから派生したものです。
    元のソースデータセットは、BionLP Shared Task 2011からのものです。
    完全な未処理のバージョンは、genia - event - 2011データセットにもあるようです。

    TEESのライセンス情報については、このリンクを参照してください。
    GENIAデータセットのライセンス情報については、このKaggleデータセットのデータファイル(.csv)の隣にある「GE11 - LICENSE」ファイルを参照してください。

    写真のクレジット:Louis ReedUnsplash


    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:7 Go earn points?
    • 567
    • 10
    • 0
    • collect
    • Share