Open Dataset
Data Structure ?
148.24M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
コンテキスト
このデータセットは、bAbIプロジェクトにおけるテキスト理解と推論のテスト用の最初の20のタスクセットを提示します。これらのタスクについては、論文「Jason Weston, Antoine Bordes, Sumit Chopra, Alexander M. Rush, Bart van Merri?nboer, Armand Joulin and Tomas Mikolov.」 [Towards AI Complete Question Answering: A Set of Prerequisite Toy Tasks, arXiv:1502.05698.](https://arxiv.org/pdf/1502.05698.pdf) で詳細に説明されています。
また、以下のスライドも参照してください。
[Antoine Bordes Artificial Tasks for Artificial Intelligence, ICLR keynote, 2015.](http://www.thespermwhale.com/jaseweston/babi/abordes-ICLR.pdf)
各タスクの目的は、テキストと推論の独自の側面をテストし、学習モデルの異なる能力をテストすることです。将来的には、より多くの側面を網羅するために、さらに多くのタスクが計画されています。
内容
**訓練データセットのサイズ**:各タスクについて、訓練用に1000の質問があり、テスト用に1000の質問があります。ただし、我々は、タスクで良好な結果を得るためにできるだけ少ないデータを使用することが目標であることを強調します(つまり、1000より少ないデータを使用できればさらに良いです)。また、他のタスクに一般化できないタスク固有のトリックに頼らないでください。これらは後続のタスクではあまり役に立たない可能性があります。評価時の目標は、すべてのタスクで _同じ_ 学習器を使用して、その技能と能力を評価することです。
**監督信号**:さらに、論文中のMemNNの結果は完全な監督(支持事実を含む)を使用していますが、弱い監督による結果も最終的には好ましいです。なぜなら、この種のデータは収集が容易だからです。したがって、その形式の結果は大歓迎です。例えば、[この論文](https://arxiv.org/pdf/1503.08895.pdf) は弱い監督による結果を含んでいます。
上記の理由から、現在いくつかのディレクトリがあります。
1) en/ — 人間が読める英語のタスク。
2) hn/ — 人間が読めるヒンディー語のタスク。
3) shuffled/ — 文字をシャッフルした同じタスクで、人間には読めず、既存のパーサーやタガーを使って余分なリソースを利用することができません。この場合、学習器は与えられた訓練データに依存する必要があります。これは、学習器が初めて言語を提示され、ゼロから学習する状況を模倣しています。
4) en-10k/ shuffled-10k/ および hn-10k/ — 3つの形式の同じタスクですが、訓練例が1000ではなく10,000になっています。論文中の結果は1000の訓練例を使用しています。
**バージョン**:最初のリリース以来、いくつかの小さな更新が行われています(データダウンロードのREADMEを参照してください)。v1.0とv1.1は [ここ](https://research.fb.com/downloads/babi/) から取得することもできます。
謝辞
他の人の助けがなければ、私たちはここにいることはできません。あなたが何らかの謝辞や感謝を述べる必要がある場合、それらをここに記載し、過去の研究の引用も含めてください。
インスピレーション
目的は、機械学習コミュニティにこれらのタスクに取り組み、さらに開発することを促すことです。
参考文献
- https://research.fb.com/downloads/babi/
×
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.