Select Language

Open Dataset

WikiLinks:大規模なクロスドキュメント照応解消英語コーパスデータ

WikiLinks:大規模なクロスドキュメント照応解消英語コーパスデータ

1.7G
857 hits
0 likes
2 downloads
0 discuss
NLP,Languages Text

Wikilinksは大規模な文書間照応解消の英語コーパスデータで、Wikipediaサイトの300万のエンティティから4000万の照応関係を抽出します。自由テキストから......

Data Structure ? 1.7G

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    Wikilinksは、Wikipediaサイトの300万のエンティティから4000万の指示関係を抽出した、大規模な文書間照応解消の英語コーパスデータです。自由なテキストから情報を抽出する主な目的は、言及されたエンティティを識別することであり、これはテキストの命題内容を抽出する前提となります。
    単一の文書内では、共参照解析によって、代名詞、指示語、または確定記述などの表現の参照対象を見つけることができます。文書集合内では、文書間共参照によって、それぞれの異なる言及集合内で言及されたエンティティを見つけることができます。文書間共参照は、それ自体が情報抽出の有用な出力であるだけでなく、他の情報抽出タスクもサポートします。

    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:15 Go earn points?
    • 857
    • 2
    • 0
    • collect
    • Share