Open Dataset
Data Structure ?
10.4G
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
関係抽出(RE)は、一対のパラメータ間に意味関係を割り当てるタスクです。REシステムには2つの形式があります。閉域では、閉じた関係フレーズのセットを使用して関係を指定し、開域では、任意のフレーズを使用してパラメータ間の関係を記述することができます。REシステムの出力は、質問応答、情報抽出などのさまざまな下流アプリケーションに使用できます。REシステムは、英語や少数の構文解析ツール(パーサー、品詞タガー、命名エンティティ解析器)が有効な言語については正常に機能しますが、解析ツールが利用できない場合、世界の大多数の言語に対してREシステムを開発する取り組みはほとんどありません。しかし、私たちは英語と他の多くの言語間の翻訳システムを持っています。FaruquiとKumar(2015)は、多言語REに使用する言語間投影アルゴリズムを説明しています。このアルゴリズムは、外国語のテキストを英語に翻訳し、英語の関係抽出を実行し、それらの関係を外国語に投影することで実現されます。本文では、このアルゴリズムをWikipediaから10の言語の多言語関係を抽出する際の応用について紹介します。本文ではまた、フランス語、ロシア語、ヒンディー語の3つの言語に対する人間による注釈付きアルゴリズムの性能を報告します。このデータセットは、このアルゴリズムを使用して自動抽出された関係のセットと、このアルゴリズムを評価するための人間による注釈のセットを提供します。英語で関係抽出を実行し、それらの関係を外国語に投影する。本文では、このアルゴリズムをWikipediaから10の言語の多言語関係を抽出する際の応用について紹介します。本文ではまた、フランス語、ロシア語、ヒンディー語の3つの言語に対する人間による注釈付きアルゴリズムの性能を報告します。このデータセットは、このアルゴリズムを使用して自動抽出された関係のセットと、このアルゴリズムを評価するための人間による注釈のセットを提供します。英語で関係抽出を実行し、それらの関係を外国語に投影する。本文では、このアルゴリズムをWikipediaから10の言語の多言語関係を抽出する際の応用について紹介します。本文ではまた、フランス語、ロシア語、ヒンディー語の3つの言語に対する人間による注釈付きアルゴリズムの性能を報告します。このデータセットは、このアルゴリズムを使用して自動抽出された関係のセットと、このアルゴリズムを評価するための人間による注釈のセットを提供します。
データソース 関係抽出は、フランス語、ロシア語、中国語、アラビア語、ヒンディー語、インドネシア語、タガログ語、ラトビア語、スワヒリ語、グルジア語といった言語を使用して、多言語Wikipediaコーパスの文章から実行されました。
詳細な紹介情報については、Readmeファイルをご覧ください。
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
- Share your thoughts
ALL
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.