Open Dataset
Data Structure ?
10.19M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
文脈
ICLR(国際表現学習会議)は、主要な機械学習会議です。他の2つの旗艦的な機械学習会議であるICMLとNIPSとは異なり、ICLRは単盲査の公開査読プロセスを採用しており、査読とそれに対する反論がともに透明かつ公開された形で行われます。このデータセットは、公開されている[ICLR 2017論文査読サイト][1]をクローリングして作成されました。2018年からICLRは二重盲査に移行するようですので、私の推測では、査読プロセス中は著者が匿名であり続けることになるでしょう。したがって、このデータセットは、学術的所属や拒否を含むすべての論文の決定とともに公開された学術査読プロセスを捉えているという点で独特です。
内容
このデータセットは2つのCSVファイルで構成されています。
- **iclr2017_papers.csv**:このファイルは、各投稿に1行が割り当てられています。論文のタイトル、著者、著者の利害関係、概要、tl;dr(簡略化された概要)、および最終決定(受理/口頭発表、受理/ポスター発表、受理/ワークショップ招待、拒否)が含まれています。各行には「paper_id」と呼ばれる一意の識別キーがあります。
- **iclr2017_conversations.csv**:このファイルは、各テキスト形式の査読、反論、またはコメントに1行が割り当てられています。二次キー「paper_id」を使用して、前の論文データセットと関連付けられています。単一の論文について話し合っているすべての行は同じ「paper_id」を共有しています。各論文に関連する会話は、森と考えることができます。森の各木は、査読から始まり、それに反論やさらなるコメント/会話が続きます。個人によって作成された各テキストエントリは、それぞれの行にリストされています。木のノードは、「child_id」と「parent_id」のフィールドを使用して接続されており、これらを使用して会話の階層構造全体を構築することができます。
謝辞
概要のすべての権利は論文の著者に帰属します。ここでの概要の複製は、研究目的のみを目的としています。このデータセットの整理プロセスを大幅に簡素化したBeautiful Soup 4 Pythonパッケージの著者に感謝します。
着想
このデータセットは、論文の投稿と受理における性別格差を理解するために作成されました。各著者に二値の性別を付与する作業はまだ残っています。このデータセットは、交渉、説得、および意思決定において採用されているコミュニケーションプロセスをモデル化するためにも使用できます。このデータセットの別の用途は、テキストの時系列データのモデル化と理解にあります。
[1]: https://openreview.net/group?id=ICLR.cc/2017/conference
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.