Select Language

AI Technology Community

2021 cvpr PVGNet:ボトムアップの単段三次元物体検出器、多層的な機能を集積

特徴
苗振伟、陈继凯、潘宏宇、张瑞文、刘凯旋、郝沛涵、朱军、王洋、詹鑫;IEEE/CVFコンピュータビジョンとパターン認識会議(CVPR)論文集,2021年,pp. 3279 - 3288
概要

量子化に基づく手法は、コンテキスト情報を抽出する際の効率性から、LiDAR点の3次元物体検出に広く用いられています。画像ではコンテキスト情報が物体全体に均一に分布しているのとは異なり、ほとんどのLiDAR点は物体の境界に沿って分布しています。これは、LiDAR点の3次元検出において境界特徴がより重要であることを意味します。しかし、学習と推論の段階では、量子化によって不可避的に曖昧性が生じます。この問題を緩和するために、我々は投票に基づく単一ステージの3次元検出器、すなわち点 - ボクセル - グリッドネットワーク(PVGNet)を提案します。特に、PVGNetは統一的なバックボーンアーキテクチャの中で点、ボクセル、グリッドレベルの特徴を抽出し、点状の融合特徴を生成します。これはLiDAR点を前景と背景に分割し、各前景の点に対して3次元バウンディングボックスを予測し、グループ投票を行って最終的な検出結果を得ます。さらに、遮蔽や観測距離によるインスタンスレベルの点の不均衡も検出性能を低下させることを我々は観察しました。我々はこの問題を緩和し、検出能力をさらに向上させるために、新しいインスタンス感知型のフォーカス損失を提案します。我々はKITTIとWaymoデータセットで実験を行いました。我々が提案したPVGNetは従来の最先端手法を上回り、KITTI 3D/BEV検出ランキングで上位にランクインしています。

関連資料    

[pdf] [bibtex]

post
CVPR
2021-12-11 13:44:50join communtity
  • 6

    item of content
CVPRはIEEE Conference on Computer Vision and Pattern Recognition(IEEE国際計算機視覚とパターン認識会議)の略称であり、IEEEが主催する計算機視覚およびパターン認識分野のトップカンファレンスです。