Select Language

Open Dataset

Visual Question Answering V2.0 画像内容に対する自然言語での質問応答用データセット

Visual Question Answering V2.0 画像内容に対する自然言語での質問応答用データセット

30.7G
1035 hits
0 likes
1 downloads
0 discuss
NLP Text

ビジュアル質問応答(VQA)は、画像内容に関する自然言語の質問と回答が画像内容に基づく必要がある、画像内容に対する自然言語の質問応答データセットです。......

Data Structure ? 30.7G

    README.md

    ビジュアル質問応答(VQA)は、画像内容に関する自然言語の質問と回答のデータセットであり、画像に関する自然言語の質問と回答をするには、画像内容、自然言語、常識を賢く活用する必要があります。25万枚の画像が含まれ、各画像には自然言語で記述された3つの質問があり、各質問には10個の正解と3個の近似解があります。

    • 265,016枚の画像(COCOと抽象シーン)

    • 各画像に少なくとも3つの質問(平均5.4個の質問)

    • 各質問に10個の基本事実の回答

    • 各質問に3つの妥当(ただし正しくない可能性がある)な回答

    • 自動評価指標

     


    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:30 Go earn points?
    • 1035
    • 1
    • 0
    • collect
    • Share