科技
ICRA 2026|Depth Completion模型,低成本雷达突破野外度量深度估算
作者:研梦非凡人工智能 原文链接链接:https://zhuanlan.zhihu.com/p/2031071527085528949 arXiv 预印本链接:https://arxiv.org/abs/2603.XXXXX (注:2026年ICRA录用论文的 arXiv 编号,通常在作者推特或项目主页首发直达) GitHub 代码仓库:https://github.com/field-robotics/extreme-sparse-depth-completion (该团队已宣布开源,包含野外环境测试数据集与预训练权重) 项目主页 (Project Page):https://field-robotics.github.io/sparse-depth-icra2026/ (内含高帧率的算法真机运行 Demo 视频) Depth Completion in Unseen Field Robotics Environments Using Extremely Sparse Depth Measurements (ICRA 2026) 【亮点速览】 攻克野外“盲区”:在深海、冰川、农业等低纹理、缺乏尺度信息的野外无结构环境中,纯视觉单目深度估计往往失效。本文提出了一种全新的深度补全(Depth Completion)模型,仅利用极度稀疏的深度测量点(如低成本雷达,每帧仅10个点级别),就能预测出高精度的密集度量深度。 极低延迟部署:算法在Nvidia Jetson AGX Orin 边缘计算平台上实现了每帧53ms的端到端延迟,完全满足野外移动机器人的实时机载计算需求。 【创新点】 第四通道融合架构:基于SOTA的单目深度估计模型 Depth Anything V2 (DAV2),创新性地修改了编码器层,引入了表示稀疏深度测量的“第四输入通道”。该架构既保留了原模型强大的泛化能力,又成功注入了绝对尺度信息。 针对野外场景的合成数据管线:针对真实野外深度数据集匮乏的问题,利用无人机图像结合运动恢复结构(SfM)生成带有纹理的3D网格,再通过Blender渲染多视角图像和深度真值,生成了专门针对野外环境的高质量合成训练集,极大降低了数据采集成本。 【成果】 图1:野外真实环境下的极稀疏深度补全表现。 (a)工业厂房、农田、冰川、压载舱和水下峡湾等五个未见过的复杂野外场景输入,图中的蓝色方块代表每帧极少数的稀疏深度测量值(如由低成本雷达或特征点追踪获取);(b)模型仅利用这些极稀疏提示作为引导,即可在缺乏绝对尺度和低纹理的恶劣条件下,成功预测并输出高精度的密集度量深度图。 雷峰网
雷峰 雷峰网更新于 5小时前1 分钟阅读
作者:研梦非凡人工智能 原文链接链接:https://zhuanlan.zhihu.com/p/2031071527085528949 arXiv 预印本链接:https://arxiv.org/abs/2603.XXXXX (注:2026年ICRA录用论文的 arXiv 编号,通常在作者推特或项目主页首发直达) GitHub 代码仓库:https://github.com/field-robotics/extreme-sparse-depth-completion (该团队已宣布开源,包含野外环境测试数据集与预训练权重) 项目主页 (Project Page):https://field-robotics.github.io/sparse-depth-icra2026/ (内含高帧率的算法真机运行 Demo 视频) Depth Completion in Unseen Field Robotics Environments Using Extremely Sparse Depth Measurements (ICRA 2026) 【亮点速览】 攻克野外“盲区”:在深海、冰川、农业等低纹理、缺乏尺度信息的野外无结构环境中,纯视觉单目深度估计往往失效。本文提出了一种全新的深度补全(Depth Completion)模型,仅利用极度稀疏的深度测量点(如低成本雷达,每帧仅10个点级别),就能预测出高精度的密集度量深度。 极低延迟部署:算法在Nvidia Jetson AGX Orin 边缘计算平台上实现了每帧53ms的端到端延迟,完全满足野外移动机器人的实时机载计算需求。 【创新点】 第四通道融合架构:基于SOTA的单目深度估计模型 Depth Anything V2 (DAV2),创新性地修改了编码器层,引入了表示稀疏深度测量的“第四输入通道”。该架构既保留了原模型强大的泛化能力,又成功注入了绝对尺度信息。 针对野外场景的合成数据管线:针对真实野外深度数据集匮乏的问题,利用无人机图像结合运动恢复结构(SfM)生成带有纹理的3D网格,再通过Blender渲染多视角图像和深度真值,生成了专门针对野外环境的高质量合成训练集,极大降低了数据采集成本。 【成果】 图1:野外真实环境下的极稀疏深度补全表现。 (a)工业厂房、农田、冰川、压载舱和水下峡湾等五个未见过的复杂野外场景输入,图中的蓝色方块代表每帧极少数的稀疏深度测量值(如由低成本雷达或特征点追踪获取);(b)模型仅利用这些极稀疏提示作为引导,即可在缺乏绝对尺度和低纹理的恶劣条件下,成功预测并输出高精度的密集度量深度图。 雷峰网
正在拉取原文正文,下次刷新即可看到完整段落。当前仅展示摘要与 AI 分析。