/Blogs_lovelt/images/avatar.jpg

Difficulty-Aware Label-Guided Denoising for Monocular 3D Object Detection


🏛️ 会议/期刊:AAAI
📅 发表年份:2026
💻 开源代码MonoDLGD
📄 论文题目Difficulty-Aware Label-Guided Denoising for Monocular 3D Object Detection


一、 背景、研究目的与核心问题

  • 研究背景: 在基于 Transformer 的单目 3D 目标检测中,通过向真实标签注入噪声并让模型去重构(即查询去噪 Query Denoising),能有效加速模型收敛并提升几何感知能力。

Mono3DV: Monocular 3D Object Detection with 3D-Aware Bipartite Matching and Variational Query DeNoising


🏛️ 会议/期刊:CVPR / ICCV / ECCV
📅 发表年份:2026
💻 开源代码: 无
📄 论文题目Mono3DV: Monocular 3D Object Detection with 3D-Aware Bipartite Matching and Variational Query DeNoising


一、 背景、研究目的与核心问题

  • 研究背景: 近年来,基于 Transformer(特别是 DETR 架构)的模型在 2D 目标检测中取得了巨大成功,并顺理成章地被引入到单目 3D 目标检测(M3OD)领域。这类模型依赖“查询(Query)”机制和“二分图匹配(Bipartite Matching)”来端到端地输出检测结果,无需繁琐的非极大值抑制(NMS)。

Object-Scene-Camera Decomposition and Recomposition for Data-Efficient Monocular 3D Object Detection


🏛️ 会议/期刊:IJCV
📅 发表年份:2026
💻 开源代码GitHub 链接
📄 论文题目Object-Scene-Camera Decomposition and Recomposition for Data-Efficient Monocular 3D Object Detection


一、 背景、研究目的与核心问题

  • 研究背景: 单目 3D 目标检测本身是一个病态(ill-posed)问题,由于缺乏深度信息,模型极度依赖海量、多样化的训练数据来学习鲁棒的特征。

SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding


🏛️ 会议/期刊:CVPR / ICCV / ECCV
📅 发表年份:2026
💻 开源代码
📄 论文题目SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding


一、 背景、研究目的与核心问题

  • 研究背景: 在自动驾驶等领域,3D 目标检测是核心技术。其中,“单目 3D 目标检测”由于仅依赖单张图像,硬件成本极低,备受青睐。然而,传统基于人工神经网络(ANNs)的模型计算量大、能耗极高,给边缘计算设备的电池续航和散热带来了巨大压力。

SPAN: Spatial-Projection Alignment for Monocular 3D Object Detection


🏛️ 会议/期刊:CVPR / ICCV / ECCV
📅 发表年份:2026
💻 开源代码GitHub 链接
📄 论文题目SPAN: Spatial-Projection Alignment for Monocular 3D Object Detection


1. 文献背景与研究动机

背景与现状

单目3D目标检测(Monocular 3D Object Detection)是自动驾驶和机器人视觉中的核心任务,旨在仅通过单张RGB图像预测物体的3D边界框。