Select Language

Open Dataset

命名エンティティ認識に使用する注釈付きコーパス、BIOおよびPOSタグで注釈付けされたコーパス

命名エンティティ認識に使用する注釈付きコーパス、BIOおよびPOSタグで注釈付けされたコーパス

2.21M
594 hits
0 likes
1 downloads
0 discuss
Business,Arts and Entertainment,Literature,Languages Classification

固有表現抽出のための注釈付き(BIO)コーパス このコーパスはニュースサイトのテキストから構成され、特に作成されたものです......

Data Structure ? 2.21M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    固有表現認識のための注釈付き(BIO)コーパス

    このコーパスはニュースサイトのテキストから構成されており、PERやLOCなどの固有表現を予測する分類器を訓練するために特別に構築されています。

    注釈スキーム:

    品詞
    BIOタグ

    タグ付けされたエンティティの数:

    「O」: 167112
    「PER」: 11692
    「ORG」: 9736
    「LOC」: 8431
    「MISC」: 4195
    文の数: 14000

    エンティティに関する重要な情報:

    O = その他
    PER = 人物
    ORG = 組織
    LOC = 地理的エンティティ
    MISC = その他のもの


    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:6 Go earn points?
    • 594
    • 1
    • 0
    • collect
    • Share