Select Language

Open Dataset

JRC Names 固有専有名詞データベース

JRC Names 固有専有名詞データベース

762.56M
1614 hits
0 likes
7 downloads
0 discuss
NLP Text

JRC-Namesは、個人および組織名(「エンティティ」と呼ばれる)に使用される高度に多言語の命名エンティティリソースです。それは大量の名前リストとその複数の綴りバリエーションを含んでいます(単一の人......

Data Structure ? 762.56M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    JRC-Namesは、個人や組織の名前(「エンティティ」と呼ばれる)に関する高度な多言語の命名エンティティリソースです。これには大量の名前リストとその複数の綴りバリエーション(一人の個人につき最大数百種類)が含まれており、異なる文字体系(ラテン語、ギリシャ語、アラビア語、キリル文字、日本語、中国語など)も含まれます。2016年3月以降、JRC-Namesはリンクデータとしても提供され、各言語での出現頻度、エンティティと共に見つかる肩書き、日付範囲などの追加情報も含まれています。

    JRC-Namesは何に使えますか?
    JRC-Namesは、名前が異なる綴りで記載されていてもそれを見つけるための技術リソースですが、テキストマイニングなどのテキストを処理するITシステムの有用な構成要素でもあります。

    JRC-Namesはどのように生成されますか?
    JRC-Namesは、欧州メディアモニター(EMM)シリーズのアプリケーションが毎日約22万件のニュース記事を分析する副産物です。

    JRC-Namesの統計情報
    JRC-Namesには、EMMの名前データベースの最重要な名前、すなわち頻繁に見つかる名前やWikipedia上で手動で検証または見つかった名前が含まれています。

    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:10 Go earn points?
    • 1614
    • 7
    • 0
    • collect
    • Share