Open Vocabulary Monocular 3D Object Detection

🏛️ 会议/期刊:3DV 📅 发表年份:2026 💻 开源代码:UVA-Computer-Vision-Lab/ovmono3d 📄 论文题目:Open Vocabulary Monocular 3D Object Detection 一、 背景、研究目的与核心问题 研究背景: 传统的单目 3D 目标检测(M3OD)模型都属于“闭集(Closed-set)”学习。这意味着模型只能检测训练集中预先定义好的那几种类别(例如 KITTI 数据集里的车、人、自行车)。但在真实的自动驾驶或机器人场景中,会遇到无数的长尾目标(如遗落的轮胎、奇形怪状的施工路障、甚至是一只突然窜出的动物)。 ...

PLOT: Pseudo-Labeling via Object Tracking for Monocular 3D Object Detection

🏛️ 会议/期刊:ICLR 📅 发表年份:2026 💻 开源代码:无 📄 论文题目:PLOT: Pseudo-Labeling via Object Tracking for Monocular 3D Object Detection 一、 背景、研究目的与核心问题 研究背景: 单目 3D 目标检测模型极度“吃数据”。然而,人工标注 3D 边界框极其昂贵且耗时,导致目前带 3D 标签的数据集规模很小,严重限制了模型的泛化能力。 ...