Open Dataset
Data Structure ?
2.8M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
感情極性データセット
極性データセット v2.0 (3.0Mb) ( README v2.0 を含む): 処理済みの肯定的レビュー1000件と否定的レビュー1000件。Pang/Lee ACL 2004で紹介された。2004年6月に公開。
未処理のHTMLファイル27886個のデータプール (81.1Mb)。極性データセット v2.0 はここから派生したものです。(このファイルは、データ公開 v1.0 の movie.zip と同じです。)
文極性データセット v1.0 ( 文極性データセット README v1.0 を含む): 処理済みの肯定的な文/断片5331個と否定的な文/断片5331個。Pang/Lee ACL 2005で紹介された。2005年7月に公開。
アーカイブ:
極性データセット v1.0 (2.8Mb) ( README を含む): 処理済みの肯定的レビュー700件と否定的レビュー700件。2002年7月に公開。
極性データセット v1.1 (2.2Mb) ( README.1.1 を含む): およそ処理済みの肯定的レビュー700件と否定的レビュー700件。2002年11月に公開。この代替バージョンは Nathan Treloar によって作成されました。彼はいくつかの非英語/不完全なレビューを削除し、一部のラベルを変更しました(元の著者の評価とは異なる極性を判断しました)。v1.1に対して行われた変更の完全なリストは diff.txt に記載されています。
極性データセット v0.9 (2.8Mb) ( README を含む): 処理済みの肯定的レビュー700件と否定的レビュー700件。Pang/Lee/Vaithyanathan EMNLP 2002で紹介された。2002年7月に公開。READMEの「Rating Information - WARNING」セクションを必ず読んでください。
movie.zip (81.1Mb): IMDbアーカイブから収集したすべてのHTMLファイル。
感情スケールデータセット
スケールデータセット v1.0 ( スケールデータ README v1.0 を含む): ラベルが評価スケールから得られたドキュメントのコレクション。Pang/Lee ACL 2005で紹介された。2005年7月に公開。
2009年9月30日: Yanir Seroussi は、生のHTMLファイルの一部の書式設定ミスにより、6つのレビューが誤ってDennis Schwartzに帰属されていることを指摘しています(29411はMax Messier、29412はNorm Schrager、29418はSteve Rhodes、29419はBlake French、29420はPete Croatto、29422はRachel Gordonであるべきです)。そして1つ(23982)は空白です。
スケールデータセット v1.0 の元のレビュー ( スケールデータ README v1.0 を含む): スケールデータセット v1.0 の主観的な抜粋が抽出された元のレビュー。
主観性データセット
主観性データセット v1.0 (508K) ( 主観性 README v1.0 を含む): 処理済みの主観的な文5000個と客観的な文5000個。Pang/Lee ACL 2004で紹介された。2004年6月に公開。
未処理のソースドキュメントのデータプール (9.3Mb)。主観性データセット v1.0 の文はここから抽出されました。注: 2012年4月2日、主観的なファイルが正しいディレクトリに配置されたもので元のgzip圧縮されたターボールを置き換えました(主観性ディレクトリが空にならないようにしました。主観的なファイルは誤って間違ったディレクトリに配置されていましたが、異なる命名規則によって区別できました)。
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
- Share your thoughts
ALL
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.