Open Dataset
Data Structure ?
227M
Data Structure ?
*The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.
README.md
多種類自然言語推論(MultiNLI)コーパスは、テキスト含意情報を持つ433kの文章ペアが众包された集合です。このコーパスはSNLIコーパスをモデルにしていますが、多様な口語体と書面語体をカバーし、独自の跨語体汎化評価をサポートする点が異なります。このコーパスは、コペンハーゲンで開催されたEMNLP 2017 RepEvalワークショップの共同タスクの基礎となっています。
データ例:
前提 ラベル 仮説 フィクション 古い者はいつもカダーンを慰めてくれたが、今日だけは例外だった。 中立 カダーンは古い者をよく知っていた。 手紙 あなたの贈り物は、あなたの寛大さの恩恵を受けるすべての学生に感謝されています。 中立 何百人もの学生があなたの寛大さの恩恵を受けるでしょう。 電話会話 ええ、今あなたは知っていますよね、もし8月にみんなが休暇中だったりするときに、私たちはもう少しカジュアルな服装をすることができます。 矛盾 会社では8月は休暇禁止月です。 9・11報告書 ペンシルベニア通りの反対側で、人々はホワイトハウスのツアーのために列を作り始めました。 含意 人々はペンシルベニア通りの端で列を作りました。 データダウンロード:
MultiNLIは、JSON行(jsonl)とタブ区切りテキスト(txt)の両方の形式のZIPコーパスを含む単一のZIPファイルに配布されています。
ダウンロード:MultiNLI 1.0(227MB、ZIP)
データ引用: @InProceedings{N18-1101, 著者 = "ウィリアムズ, アディナ および ナンギア, ニキータ および ボーマン, サミュエル", タイトル = "推論を通じた文章理解のための広範なカバレッジの挑戦コーパス", 書籍名 = "2018年北米自然言語処理学会年次大会: 人間言語技術, ボリューム1(長文)の会議録", 年 = "2018", 出版社 = "自然言語処理学会", ページ = "1112--1122", 場所 = "ルイジアナ州ニューオーリンズ", URL = "http://aclweb.org/anthology/N18-1101" }
The dataset is currently being organized and other channels have been prepared for you. Please use them
The dataset is currently being organized and other channels have been prepared for you. Please use them
- Share your thoughts
ALL
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.