Select Language

Open Dataset

大型映画レビューデータセット  二値感情分類に使用されるデータセット

大型映画レビューデータセット 二値感情分類に使用されるデータセット

80.2M
919 hits
0 likes
2 downloads
0 discuss
Music Analysis,Game Classification

これは二元感情分類に使用するデータセットで、以前のベンチマークデータセットよりも多くのデータを含んでいます。私たちは25,000件の極端な映画レビューのセットを訓練用に提供しており、また2......

Data Structure ? 80.2M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    これは二元感情分類に使用するデータセットで、以前のベンチマークデータセットよりも多くのデータを含んでいます。私たちは、25,000件の極端な映画レビューのセットを訓練用に、また25,000件をテスト用に提供しています。その他にも未ラベル付きのデータが利用可能です。原文テキストと処理済みのバッグオブワード形式が提供されます。

    コアデータセットは50,000件のレビューを含み、25,000件の訓練セットと25,000件のテストセットに均等に分割されています。ラベルの全体的な分布は均衡しています(25,000件の肯定的レビューと25,000件の否定的レビュー)。私たちは、教師なし学習用にさらに50,000件の未ラベル付きドキュメントも含めています。一連のデータ全体で、同一の映画に対するレビューは30件を超えないようにしています。なぜなら、同一映画のレビューは関連する評価を持つ傾向があるからです。さらに、訓練セットとテストセットは互いに重複しない映画のセットを含んでいるため、映画固有の用語と観察されたラベルの関連付けを記憶することで、顕著な性能向上は得られません。ラベル付きの訓練/テストセットでは、否定的レビューの評価

    データ引用

      著者    = {マース, アンドリュー・L. および デイリー, レイモンド・E. および ファム, ピーター・T. および ファン, ダン および ウン, アンドリュー・Y. および ポッツ, クリストファー},
      タイトル    = {感情分析のための単語ベクトルの学習},
      書籍名 = {計算言語学会第49回年次総会: 自然言語処理技術の会議録},
      月     = {6月},
      年      = {2011},
      会場   = {アメリカ合衆国オレゴン州ポートランド},
      出版社 = {計算言語学会},
      ページ    = {142--150},
      URL      = {http://www.aclweb.org/anthology/P11-1015}
    }
    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:6 Go earn points?
    • 919
    • 2
    • 0
    • collect
    • Share