Open Dataset
Data Structure ?
794.68M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
このデータセットは、私がセビリア大学で博士号を取得する間に作成されました(http://www.tdg-seville.info/fogallego/Personal%20Info)。ラベル付けされた条件を含むデータセットは見つからなかったので、博士号取得の主な目標がユーザー定義のパターンや特定目的の辞書、分類体系、ヒューリスティックに依存せずに条件を識別できることであったため、独自に構築することにしました。
このデータセットは、2018年マドリッド機械学習サマースクールのポスターセッションで発表されました(http://mlss.ii.uam.es/mlss2018/posters.html)。
内容
英語とスペイン語のレビューは、2017年4月から5月の間にciao.comからランダムに収集されました。文章は、その出所に応じて15のドメインに分類されました。具体的には、成人、ベビーケア、美容、書籍、カメラ、コンピューター、映画、ヘッドセット、ホテル、音楽、オーブン、ペット、携帯電話、テレビ、ビデオゲームです。
私たちのデータセットは、2つのファイルで構成されています。sentences.csvとconditions.csvです。前者には文章の全セットが含まれ、後者には手動でラベル付けされた条件が含まれています。
各列の意味をよりよく理解するために、詳細に説明します。
sentence.csv:
sentence_uuid: 文章の一意の識別子
sentence_text: 文章のテキスト
language: 文章の言語
domain: 文章のドメイン
labelled: 文章がラベル付けされているかどうか
conditions.csv:
sentence_uuid: 対応するラベル付けされた文章の一意の識別子
condition_uuid: 条件の一意の識別子
begin_connective: 条件の接続詞が始まる文字位置
end_connective: 条件の接続詞が終わる文字位置
begin_condition: 条件の残りの部分が始まる文字位置
end_condition: 条件の残りの部分が終わる文字位置
language: 対応するラベル付けされた文章の言語
domain: 対応するラベル付けされた文章のドメイン
謝辞
私の博士号取得とこのデータセットは、Opileak.comとスペインの研究開発プログラム(助成金TIN2013 - 40848 - RおよびTIN2013 - 40848 - R)によって支援されました。
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
- Share your thoughts
ALL
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.