Select Language

Open Dataset

条件付きのコメント中のラベル付きとラベル無しの文を含むデータセット

条件付きのコメント中のラベル付きとラベル無しの文を含むデータセット

794.68M
591 hits
0 likes
0 downloads
0 discuss
NLP,Text Data,Universities and Colleges,Ratings and Reviews Classification

このデータセットは私の博士号取得中に(http://www.tdg-seville.info/fogallego/Personal%20Info)セビリア大学で作成されました。......

Data Structure ? 794.68M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    このデータセットは、私がセビリア大学で博士号を取得する間に作成されました(http://www.tdg-seville.info/fogallego/Personal%20Info)。ラベル付けされた条件を含むデータセットは見つからなかったので、博士号取得の主な目標がユーザー定義のパターンや特定目的の辞書、分類体系、ヒューリスティックに依存せずに条件を識別できることであったため、独自に構築することにしました。

    このデータセットは、2018年マドリッド機械学習サマースクールのポスターセッションで発表されました(http://mlss.ii.uam.es/mlss2018/posters.html)。

    内容

    英語とスペイン語のレビューは、2017年4月から5月の間にciao.comからランダムに収集されました。文章は、その出所に応じて15のドメインに分類されました。具体的には、成人、ベビーケア、美容、書籍、カメラ、コンピューター、映画、ヘッドセット、ホテル、音楽、オーブン、ペット、携帯電話、テレビ、ビデオゲームです。

    私たちのデータセットは、2つのファイルで構成されています。sentences.csvとconditions.csvです。前者には文章の全セットが含まれ、後者には手動でラベル付けされた条件が含まれています。

    各列の意味をよりよく理解するために、詳細に説明します。

    sentence.csv:

    • sentence_uuid: 文章の一意の識別子

    • sentence_text: 文章のテキスト

    • language: 文章の言語

    • domain: 文章のドメイン

    • labelled: 文章がラベル付けされているかどうか

    conditions.csv:

    • sentence_uuid: 対応するラベル付けされた文章の一意の識別子

    • condition_uuid: 条件の一意の識別子

    • begin_connective: 条件の接続詞が始まる文字位置

    • end_connective: 条件の接続詞が終わる文字位置

    • begin_condition: 条件の残りの部分が始まる文字位置

    • end_condition: 条件の残りの部分が終わる文字位置

    • language: 対応するラベル付けされた文章の言語

    • domain: 対応するラベル付けされた文章のドメイン

    謝辞

    私の博士号取得とこのデータセットは、Opileak.comとスペインの研究開発プログラム(助成金TIN2013 - 40848 - RおよびTIN2013 - 40848 - R)によって支援されました。


    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:30 Go earn points?
    • 591
    • 0
    • 0
    • collect
    • Share