Select Language

Open Dataset

AI2推論チャレンジ(ARC)2018データセット

AI2推論チャレンジ(ARC)2018データセット

649.3M
680 hits
0 likes
2 downloads
0 discuss
MNIST Classification

ARCデータセットには、様々なソースから抽出された7,787の科学試験問題が含まれており、その中にはAI2の関連研究パートナーからライセンスを得て提供された科学問題も含まれています。これらは純粋なテキストの英語の試験問題です。......

Data Structure ? 649.3M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    ARCデータセットには、様々なソースから抽出された7,787の科学試験問題が含まれており、その中にはAI2の関連研究パートナーから提供された科学問題も含まれています。これらは純粋なテキストの英語の試験問題で、文書に記載されている複数の学年をカバーしています。各問題には選択肢構造があり(通常は4つの答えの選択肢があります)。これらの問題は、2590の「難問」チャレンジ問題セット(検索と共起方法のどちらも正しく答えられない問題)と5197の簡単な問題セットに分けられています。それぞれは、以下のように事前に訓練セット、開発セット、テストセットに分けられています:

    • 難問訓練セット:1,119

    • 難問開発セット:299

    • 難問テストセット:1,172

    • 簡易訓練セット:2,251

    • 簡易開発セット:570

    • 簡易テストセット:2,376

    各セットはCSVとJSONの2つの形式で提供されます。CSVファイルには、問題の全文とその答えの選択肢が1つのセルに含まれています。JSONファイルには、問題の分割バージョンが含まれており、問題テキストはプログラムによって答えの選択肢と分離されています。

    ARCコーパス

    ARCコーパスには、1400万の無秩序な科学関連の文が含まれており、ARCに関連する知識が含まれており、チャレンジに取り組む起点として機能します。コーパスには以下の文が含まれています:Webからダウンロードした科学関連の文書;ウィクショナリーの辞書定義、およびシンプルウィキペディアの科学としてマークされた記事。その構築の詳細については、(Clark et al.,2018)を参照してください。なお、「チャレンジ」にコーパスを使用することは完全に任意であり、システムはこのコーパスに限定されません。詳細情報とこのコーパスの使用条件については、ダウンロードに含まれるREADMEファイルを参照してください。


    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:9 Go earn points?
    • 680
    • 2
    • 0
    • collect
    • Share