CenterNet-Based - 分类 - Zhaoylee's Blogs

OCM3D: Object-Centric Monocular 3D Object Detection

zhaoylee — Mon, 16 Mar 2026 09:12:18 +0800

🏛️ 会议/期刊：arxiv
📅 发表年份：2021
💻 开源代码：OBMO_GUPNet
📄 论文题目：OCM3D: Object-Centric Monocular 3D Object Detection

1. 文献背景、研究目的与核心问题

研究背景：单目 3D 目标检测（Monocular 3D Object Detection）是一个高度病态（ill-posed）的问题。主流方法通常依赖纯图像或将其转化为伪激光雷达（Pseudo-LiDAR）点云。然而，前者难以捕捉像素间的 3D 空间几何关系，后者则受困于单目深度估计带来的巨大点云噪声。

LR3D: Improving Distant 3D Object Detection Using 2D Box Supervision

zhaoylee — Sun, 15 Mar 2026 22:23:00 +0800

🏛️ 会议/期刊：CVPR
📅 发表年份：2024
💻 开源代码：无
📄 论文题目：Improving Distant 3D Object Detection Using 2D Box Supervision

这篇由 NVIDIA 等机构的研究人员发表在 CVPR 2024 的重磅论文 《Improving Distant 3D Object Detection Using 2D Box Supervision》(简称 LR3D)，切入了一个目前高阶自动驾驶极其头疼的落地难题：远距离感知（Long-Range Detection）。它展示了如何用最廉价的标注，榨取单目视觉在远距离上的极限潜力。

PLOT: Pseudo-Labeling via Object Tracking for Monocular 3D Object Detection

zhaoylee — Sun, 15 Mar 2026 20:52:51 +0800

🏛️ 会议/期刊：ICLR
📅 发表年份：2026
💻 开源代码：无
📄 论文题目：PLOT: Pseudo-Labeling via Object Tracking for Monocular 3D Object Detection

一、背景、研究目的与核心问题

研究背景： 单目 3D 目标检测模型极度“吃数据”。然而，人工标注 3D 边界框极其昂贵且耗时，导致目前带 3D 标签的数据集规模很小，严重限制了模型的泛化能力。

SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding

zhaoylee — Sun, 15 Mar 2026 19:59:10 +0800

🏛️ 会议/期刊：CVPR / ICCV / ECCV
📅 发表年份：2026
💻 开源代码：无
📄 论文题目：SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding

一、背景、研究目的与核心问题

研究背景： 在自动驾驶等领域，3D 目标检测是核心技术。其中，“单目 3D 目标检测”由于仅依赖单张图像，硬件成本极低，备受青睐。然而，传统基于人工神经网络（ANNs）的模型计算量大、能耗极高，给边缘计算设备的电池续航和散热带来了巨大压力。

MonoCT: Overcoming Monocular 3D Detection Domain Shift with Consistent Teacher Models

zhaoylee — Thu, 12 Mar 2026 10:25:13 +0800

🏛️ 会议/期刊：ICRA
📅 发表年份：2025
💻 开源代码：GitHub 链接
📄 论文题目：MonoCT: Overcoming Monocular 3D Detection Domain Shift with Consistent Teacher Models

0. 一句话总结 (TL;DR)

(这篇论文用什么方法，解决了什么问题，达到了什么效果)
MonoCT 提出了一种基于一致性教师模型（Consistent Teacher）的半监督自适应框架，通过在目标域（Target Domain）引入伪标签一致性约束，有效解决了单目 3D 检测在不同数据集间迁移时的深度估计偏差问题。

CenterNet-Based - 分类 - Zhaoylee's Blogs

OCM3D: Object-Centric Monocular 3D Object Detection

1. 文献背景、研究目的与核心问题

LR3D: Improving Distant 3D Object Detection Using 2D Box Supervision

PLOT: Pseudo-Labeling via Object Tracking for Monocular 3D Object Detection

一、 背景、研究目的与核心问题

SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding

一、 背景、研究目的与核心问题

MonoCT: Overcoming Monocular 3D Detection Domain Shift with Consistent Teacher Models

0. 一句话总结 (TL;DR)

一、背景、研究目的与核心问题

一、背景、研究目的与核心问题