Select Language

Open Dataset

bAbIタスクデータ

bAbIタスクデータ

148.24M
346 hits
0 likes
3 downloads
0 discuss
Arts and Entertainment,Computer Science,Education,Programming,NLP,Deep Learning Classification

Data Structure ? 148.24M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    コンテキスト このデータセットは、bAbIプロジェクトにおけるテキスト理解と推論のテスト用の最初の20のタスクセットを提示します。これらのタスクについては、論文「Jason Weston, Antoine Bordes, Sumit Chopra, Alexander M. Rush, Bart van Merri?nboer, Armand Joulin and Tomas Mikolov.」 [Towards AI Complete Question Answering: A Set of Prerequisite Toy Tasks, arXiv:1502.05698.](https://arxiv.org/pdf/1502.05698.pdf) で詳細に説明されています。 また、以下のスライドも参照してください。 [Antoine Bordes Artificial Tasks for Artificial Intelligence, ICLR keynote, 2015.](http://www.thespermwhale.com/jaseweston/babi/abordes-ICLR.pdf) 各タスクの目的は、テキストと推論の独自の側面をテストし、学習モデルの異なる能力をテストすることです。将来的には、より多くの側面を網羅するために、さらに多くのタスクが計画されています。 内容 **訓練データセットのサイズ**:各タスクについて、訓練用に1000の質問があり、テスト用に1000の質問があります。ただし、我々は、タスクで良好な結果を得るためにできるだけ少ないデータを使用することが目標であることを強調します(つまり、1000より少ないデータを使用できればさらに良いです)。また、他のタスクに一般化できないタスク固有のトリックに頼らないでください。これらは後続のタスクではあまり役に立たない可能性があります。評価時の目標は、すべてのタスクで _同じ_ 学習器を使用して、その技能と能力を評価することです。 **監督信号**:さらに、論文中のMemNNの結果は完全な監督(支持事実を含む)を使用していますが、弱い監督による結果も最終的には好ましいです。なぜなら、この種のデータは収集が容易だからです。したがって、その形式の結果は大歓迎です。例えば、[この論文](https://arxiv.org/pdf/1503.08895.pdf) は弱い監督による結果を含んでいます。 上記の理由から、現在いくつかのディレクトリがあります。 1) en/ — 人間が読める英語のタスク。 2) hn/ — 人間が読めるヒンディー語のタスク。 3) shuffled/ — 文字をシャッフルした同じタスクで、人間には読めず、既存のパーサーやタガーを使って余分なリソースを利用することができません。この場合、学習器は与えられた訓練データに依存する必要があります。これは、学習器が初めて言語を提示され、ゼロから学習する状況を模倣しています。 4) en-10k/ shuffled-10k/ および hn-10k/ — 3つの形式の同じタスクですが、訓練例が1000ではなく10,000になっています。論文中の結果は1000の訓練例を使用しています。 **バージョン**:最初のリリース以来、いくつかの小さな更新が行われています(データダウンロードのREADMEを参照してください)。v1.0とv1.1は [ここ](https://research.fb.com/downloads/babi/) から取得することもできます。 謝辞 他の人の助けがなければ、私たちはここにいることはできません。あなたが何らかの謝辞や感謝を述べる必要がある場合、それらをここに記載し、過去の研究の引用も含めてください。 インスピレーション 目的は、機械学習コミュニティにこれらのタスクに取り組み、さらに開発することを促すことです。 参考文献 - https://research.fb.com/downloads/babi/
    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:0 Go earn points?
    • 346
    • 3
    • 0
    • collect
    • Share