Open Dataset
Data Structure ?
8.2G
README.md
Flickr30kデータセットは、文ベースの画像記述における標準的なベンチマークとなっています。この論文では、Flickr30k Entitiesを紹介します。これは、Flickr30kの158kのキャプションに244kの照応連鎖を追加し、同じ画像に対する異なるキャプション間で同じエンティティの言及をリンクさせ、それらを276kの手動でアノテーションされたバウンディングボックスと関連付けます。このようなアノテーションは、自動画像記述と接地言語理解の継続的な進歩に不可欠です。これにより、画像内のテキストエンティティの言及の位置特定に関する新しいベンチマークを定義することができます。我々は、このタスクに対する強力なベースラインを提示します。これは、画像 - テキスト埋め込み、一般的なオブジェクトの検出器、色分類器、および大きなオブジェクトを選択する傾向を組み合わせたものです。我々のベースラインは、精度面でより複雑な最先端のモデルに匹敵しますが、その利点を画像 - 文の検索などのタスクの改善に容易に結びつけることができないことを示し、現在の方法の限界とさらなる研究の必要性を強調しています。
No content available at the moment
No content available at the moment
- Share your thoughts
Go share your ideas~~
ALL
Welcome to exchange and share
Your sharing can help others better utilize data.
Data usage instructions: h1>
I. Data Source and Display Explanation:
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
II. Ownership Explanation:
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
III. Data Reposting Explanation:
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
IV. Infringement and Handling Explanation:
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.
- 1. The data originates from internet data collection or provided by service providers, and this platform offers users the ability to view and browse datasets.
- 2. This platform serves only as a basic information display for datasets, including but not limited to image, text, video, and audio file types.
- 3. Basic dataset information comes from the original data source or the information provided by the data provider. If there are discrepancies in the dataset description, please refer to the original data source or service provider's address.
- 1. All datasets on this site are copyrighted by their original publishers or data providers.
- 1. If you need to repost data from this site, please retain the original data source URL and related copyright notices.
- 1. If any data on this site involves infringement, please contact us promptly, and we will arrange for the data to be taken offline.