Open Dataset
Data Structure ?
649.3M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
ARCデータセットには、様々なソースから抽出された7,787の科学試験問題が含まれており、その中にはAI2の関連研究パートナーから提供された科学問題も含まれています。これらは純粋なテキストの英語の試験問題で、文書に記載されている複数の学年をカバーしています。各問題には選択肢構造があり(通常は4つの答えの選択肢があります)。これらの問題は、2590の「難問」チャレンジ問題セット(検索と共起方法のどちらも正しく答えられない問題)と5197の簡単な問題セットに分けられています。それぞれは、以下のように事前に訓練セット、開発セット、テストセットに分けられています:
難問訓練セット:1,119
難問開発セット:299
難問テストセット:1,172
簡易訓練セット:2,251
簡易開発セット:570
簡易テストセット:2,376
各セットはCSVとJSONの2つの形式で提供されます。CSVファイルには、問題の全文とその答えの選択肢が1つのセルに含まれています。JSONファイルには、問題の分割バージョンが含まれており、問題テキストはプログラムによって答えの選択肢と分離されています。
ARCコーパス
ARCコーパスには、1400万の無秩序な科学関連の文が含まれており、ARCに関連する知識が含まれており、チャレンジに取り組む起点として機能します。コーパスには以下の文が含まれています:Webからダウンロードした科学関連の文書;ウィクショナリーの辞書定義、およびシンプルウィキペディアの科学としてマークされた記事。その構築の詳細については、(Clark et al.,2018)を参照してください。なお、「チャレンジ」にコーパスを使用することは完全に任意であり、システムはこのコーパスに限定されません。詳細情報とこのコーパスの使用条件については、ダウンロードに含まれるREADMEファイルを参照してください。
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
- Share your thoughts
ALL
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.