Select Language

Open Dataset

問題回答データセット

問題回答データセット

4.61M
215 hits
0 likes
0 downloads
0 discuss
Education,Social Science,Linguistics,Languages,Artificial Intelligence Classification

Data Structure ? 4.61M

    Data Structure ?

    *The above analysis is the result extracted and analyzed by the system, and the specific actual data shall prevail.

    README.md

    コンテキスト: 自然言語処理において、質問に自動的かつ正確に回答することは依然として難しい問題です。このデータセットには、このタスクに挑戦するために必要なすべての要素が含まれています。質問が元々生成されたウィキペディアの記事テキストを与えられたとき、あなたは質問に正しく回答を生成できますか? 内容: 学生の学年ごとに1つずつ、計3つの質問ファイル(S08、S09、S10)があります。また、質問を生成するために使用されたウィキペディアからの約69万語のクリーニングされたテキストもあります。 「question_answer_pairs.txt」ファイルには、質問と回答の両方が含まれています。このファイルの列は以下の通りです。 * **ArticleTitle** は、質問と回答が最初に由来したウィキペディア記事の名前です。 * **Question** は質問です。 * **Answer** は回答です。 * **DifficultyFromQuestioner** は、質問作成者に指定された質問の難易度評価です。 * **DifficultyFromAnswerer** は、質問を評価して回答した個人によって割り当てられた難易度評価であり、4番目のフィールドの難易度と異なる場合があります。 * **ArticleFile** は、関連する記事が含まれるファイルの名前です。 不適切と判断された質問は、このデータセットから除外されています。 同じ質問が複数行にわたって表示されることがよくあります。これは、それらの質問が複数の個人によって回答された場合に起こります。 謝辞: これらのデータは、2008年から2010年の間に、ノア・スミス、マイケル・ハイルマン、レベッカ・ホワ、シェイ・コーエン、ケビン・ギンペル、およびカーネギーメロン大学とピッツバーグ大学の多くの学生によって収集されました。これらのデータはCC BY - SA 3.0の下で公開されています。上記のデータを使用した論文を執筆する場合は、この論文を引用してください。 Smith, N. A., Heilman, M., & Hwa, R. (2008年9月). Question generation as a competitive undergraduate course project. In Proceedings of the NSF Workshop on the Question Generation Shared Task and Evaluation Challenge. あなたが気に入るかもしれないもの: * [質問 - 回答ジョーク:Redditのr/jokesからの質問 - 回答形式のジョーク](https://www.kaggle.com/jiriroz/qa-jokes) * [スタンフォード質問回答データセット:10万組以上の質問 - 回答ペアに関する新しい読解データセット](https://www.kaggle.com/stanfordu/stanford-question-answering-dataset) * [質問ペアデータセット:重複する質問を識別できますか?](https://www.kaggle.com/quora/question-pairs-dataset)
    ×

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    The dataset is currently being organized and other channels have been prepared for you. Please use them

    Note: Some data is currently being processed and cannot be directly downloaded. We kindly ask for your understanding and support.
    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:0 Go earn points?
    • 215
    • 0
    • 0
    • collect
    • Share