Select Language

Open Dataset

Flickr画像データセット、Flickr画像キャプションデータセット

Flickr画像データセット、Flickr画像キャプションデータセット

8.2G
434 hits
0 likes
0 downloads
0 discuss
NLP,Image Data,Computer Vision Classification

Flickr30kデータセットは、文章ベースの画像記述の標準ベンチマークとなっています。この論文ではFlickr30......

Data Structure ? 8.2G

    README.md

    Flickr30kデータセットは、文ベースの画像記述における標準的なベンチマークとなっています。この論文では、Flickr30k Entitiesを紹介します。これは、Flickr30kの158kのキャプションに244kの照応連鎖を追加し、同じ画像に対する異なるキャプション間で同じエンティティの言及をリンクさせ、それらを276kの手動でアノテーションされたバウンディングボックスと関連付けます。このようなアノテーションは、自動画像記述と接地言語理解の継続的な進歩に不可欠です。これにより、画像内のテキストエンティティの言及の位置特定に関する新しいベンチマークを定義することができます。我々は、このタスクに対する強力なベースラインを提示します。これは、画像 - テキスト埋め込み、一般的なオブジェクトの検出器、色分類器、および大きなオブジェクトを選択する傾向を組み合わせたものです。我々のベースラインは、精度面でより複雑な最先端のモデルに匹敵しますが、その利点を画像 - 文の検索などのタスクの改善に容易に結びつけることができないことを示し、現在の方法の限界とさらなる研究の必要性を強調しています。

    No content available at the moment
    No content available at the moment
    • Share your thoughts
    Go share your ideas~~

    ALL

      Welcome to exchange and share
      Your sharing can help others better utilize data.
    Points:35 Go earn points?
    • 434
    • 0
    • 0
    • collect
    • Share