Select Language

Open Dataset

DBpediaセマンティックウェブの応用例で、42782編のウィキペディア記事に分類と階層化されたカテゴリが提供されています。

DBpediaセマンティックウェブの応用例で、42782編のウィキペディア記事に分類と階層化されたカテゴリが提供されています。

443.28M
428 hits
0 likes
0 downloads
0 discuss
Education,Text Data,Multiclass Classification,Text Mining Classification

DBpedia(データベースを意味する「DB」から由来)は、ウィキペディアで作成された情報から構造化されたコンテンツを抽出することを目的としたプロジェクトです。......

Data Structure ? 443.28M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    DBpedia(「DB」は「database(データベース)」の略)は、Wikipediaで作成された情報から構造化されたコンテンツを抽出することを目的としたプロジェクトです。
    これは、データをクリーニングした後(カーネルを含む)の抽出物で、342,782件のWikipedia記事に分類学的、階層的なカテゴリ(「クラス」)を提供します。3つのレベルがあり、それぞれ9、70、219のクラスがあります。
    このデータセットのあるバージョンは、自然言語処理(NLP)/テキスト分類タスクの一般的なベンチマークとなっています。このバージョンのデータセットは、特にL2/L3レベルをターゲットとした場合、はるかに難しいです。

    これは、階層的な多クラス/マルチラベルテキスト分類における優れたベンチマークです。
    いくつかの例となるアプローチがコードスニペットとして含まれています。

    内容

    複数レベルの階層/クラスを持つDBPediaデータセットで、多クラスデータセットとして提供されます。
    元のDBPediaオントロジー(トリプレットデータ):https://wiki.dbpedia.org/develop/datasets
    クラスツリー/分類体系の一覧:http://mappings.dbpedia.org/server/ontology/classes/


    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:13 Go earn points?
    • 428
    • 0
    • 0
    • collect
    • Share