LR3D: Improving Distant 3D Object Detection Using 2D Box Supervision

zhaoylee 发布于 2026-03-15, 更新于 2026-03-15, 收录于 CenterNet-Based 即插即用型

🏛️ 会议/期刊：CVPR
📅 发表年份：2024
💻 开源代码：无
📄 论文题目：Improving Distant 3D Object Detection Using 2D Box Supervision

这篇由 NVIDIA 等机构的研究人员发表在 CVPR 2024 的重磅论文 《Improving Distant 3D Object Detection Using 2D Box Supervision》(简称 LR3D)，切入了一个目前高阶自动驾驶极其头疼的落地难题：远距离感知（Long-Range Detection）。它展示了如何用最廉价的标注，榨取单目视觉在远距离上的极限潜力。

StreamPETR-QAF2D：Enhancing 3D Object Detection with 2D Detection-Guided Query Anchors

zhaoylee 发布于 2026-03-15, 更新于 2026-03-15, 收录于 Transformer-Based

🏛️ 会议/期刊：CVPR
📅 发表年份：2024
💻 开源代码：nullmax-vision/QAF2D-CVPR 2024
📄 论文题目：Enhancing 3D Object Detection with 2D Detection-Guided Query Anchors

这篇发表于 CVPR 2024 的论文 《Enhancing 3D Object Detection with 2D Detection-Guided Query Anchors》(简称 QAF2D) 极具工程实用价值。它没有死磕 3D 空间中的特征提取瓶颈，而是打出了一套极其聪明的“降维组合拳”，巧妙地利用成熟的 2D 视觉技术来为 3D 检测器“引路”。

OBMO: One Bounding Box Multiple Objects for Monocular 3D Object Detection

zhaoylee 发布于 2026-03-15, 更新于 2026-03-15, 收录于即插即用型

🏛️ 会议/期刊：IEEE TIP
📅 发表年份：2023
💻 开源代码：mrsempress/OBMO_patchnet
📄 论文题目：OBMO: One Bounding Box Multiple Objects for Monocular 3D Object Detection

这篇发表于 IEEE TIP (2023) 的经典论文 《OBMO: One Bounding Box Multiple Objects for Monocular 3D Object Detection》 切入点非常犀利。它没有在复杂的网络主干上做文章，而是直击单目 3D 目标检测在“底层数学物理逻辑”上的痛点，提出了一种极其优雅的“即插即用（Plug-and-play）”训练策略。

Open Vocabulary Monocular 3D Object Detection

zhaoylee 发布于 2026-03-15, 更新于 2026-03-15, 收录于开放集M3OD

🏛️ 会议/期刊：3DV
📅 发表年份：2026
💻 开源代码：UVA-Computer-Vision-Lab/ovmono3d
📄 论文题目：Open Vocabulary Monocular 3D Object Detection

一、背景、研究目的与核心问题

研究背景： 传统的单目 3D 目标检测（M3OD）模型都属于“闭集（Closed-set）”学习。这意味着模型只能检测训练集中预先定义好的那几种类别（例如 KITTI 数据集里的车、人、自行车）。但在真实的自动驾驶或机器人场景中，会遇到无数的长尾目标（如遗落的轮胎、奇形怪状的施工路障、甚至是一只突然窜出的动物）。

MonoXiver： Monocular 3D Object Detection with Bounding Box Denoising in 3D by Perceiver

zhaoylee 发布于 2026-03-15, 更新于 2026-03-15, 收录于即插即用型

🏛️ 会议/期刊：ICCV
📅 发表年份：2023
💻 开源代码：Xianpeng919/monoxiver (ICCV'23)
📄 论文题目：Monocular 3D Object Detection with Bounding Box Denoising in 3D by Perceiver

这篇发表于 ICCV 2023 的论文 《Monocular 3D Object Detection with Bounding Box Denoising in 3D by Perceiver》(简称 MonoXiver)，提供了一个非常经典且极具工程价值的“自上而下（Top-down）”纠错思路。它并没有试图发明一种全新的主干网络，而是设计了一个强大的“插件”，专门用来拯救那些定位不准的预测框。

PLOT: Pseudo-Labeling via Object Tracking for Monocular 3D Object Detection

zhaoylee 发布于 2026-03-15, 更新于 2026-03-15, 收录于 CenterNet-Based Transformer-Based 即插即用型

🏛️ 会议/期刊：ICLR
📅 发表年份：2026
💻 开源代码：无
📄 论文题目：PLOT: Pseudo-Labeling via Object Tracking for Monocular 3D Object Detection

一、背景、研究目的与核心问题

研究背景： 单目 3D 目标检测模型极度“吃数据”。然而，人工标注 3D 边界框极其昂贵且耗时，导致目前带 3D 标签的数据集规模很小，严重限制了模型的泛化能力。

LR3D: Improving Distant 3D Object Detection Using 2D Box Supervision

StreamPETR-QAF2D：Enhancing 3D Object Detection with 2D Detection-Guided Query Anchors

OBMO: One Bounding Box Multiple Objects for Monocular 3D Object Detection

Open Vocabulary Monocular 3D Object Detection

一、 背景、研究目的与核心问题

MonoXiver： Monocular 3D Object Detection with Bounding Box Denoising in 3D by Perceiver

PLOT: Pseudo-Labeling via Object Tracking for Monocular 3D Object Detection

一、 背景、研究目的与核心问题

一、背景、研究目的与核心问题

一、背景、研究目的与核心问题