Select Language

Open Dataset

名称エンティティ認識データセット

名称エンティティ認識データセット

5.64M
286 hits
0 likes
0 downloads
0 discuss
NLP Classification

人間のアノテーターによるラベルアノテーションの誤りは、固有表現抽出(NER)に2つの課題をもたらします。テストセットの誤りは干渉する可能性があります。......

Data Structure ? 5.64M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    人間のアノテーターによるラベルアノテーションの誤りは、固有表現抽出(NER)に2つの課題をもたらします。

    • テストセットの誤りは、評価結果に干渉し、さらにはモデル性能の不正確な評価につながる可能性があります。

    • トレーニングセットの誤りは、NERモデルのトレーニングに悪影響を及ぼす可能性があります。

      これら2つの問題に対処するために:

    • テストセットの誤りを手動で修正し、よりクリーンなベンチマークを作成します。

    • トレーニングセットの誤りを処理するためのフレームワークCrossWeighを開発します。

    CrossWeigh

    ner

    内容

    CrossWeighは、重み付きのトレーニングインスタンスを受け付ける任意のNERアルゴリズムと連携します。これは2つのモジュールで構成されています。1) 誤り推定:相互チェックプロセスを通じて、トレーニングデータ内の潜在的な誤りが特定される部分と、2) 誤り重み付け:最終的なNERモデルのトレーニング中に、それらの誤りの重みが下げられる部分です。

    謝辞

    Named-Entity-Recognition-NER-Papers
    劉鹏飞、傅錦蘭および他の貢献者。

    インスピレーション

    固有表現抽出


    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:12 Go earn points?
    • 286
    • 0
    • 0
    • collect
    • Share