AI
雷军谈小米自动驾驶模型 Xiaomi OneVL:业内率先通过潜空间推理将 VLA、世界模型统一到一套框架
IT之家 5 月 14 日消息,小米技术昨日正式发布并开源 Xiaomi OneVL 一步式潜空间语言视觉推理框架。 小米创办人、董事长兼 CEO 雷军昨晚发文谈及了小米自动驾驶模型 Xiaomi OneVL。他表示,Xiaomi OneVL 在业内率先通过潜空间推理,将 VLA、世界模型统一到同一套框架中。 雷军还提到,在推理、规划等多个主流基准上,Xiaomi OneVL 全面刷新了潜在推理方法的性能上限。模型与代码全面开源。雷军最后还向全球开发者、研究人员发出邀请,探索自动驾驶大模型更多可能性。 根据小米技术官方介绍,Xiaomi OneVL 在业内率先实现 VLA、世界模型、潜空间推理等多个技术路线的统一,在具备 XLA 模型强悍推理能力的基础上,大幅提升了推理的速度和精度,是行业内具备开创性的方案,在精度上超越显式 CoT、在速度上对齐“仅答案”预测的潜空间 CoT 方案。 小米已将 Xiaomi OneVL 的模型权重和训练、推理代码全面开源,IT之家汇总链接如下: 技术报告:https://arxiv.org/abs/2604.18486 项目主页:https://Xiaomi-Embodied-Intelligence.github.io/OneVL 开源代码:https://github.com/xiaomi-research/onevl
IT IT之家 AI更新于 2小时前1 分钟阅读
IT之家 5 月 14 日消息,小米技术昨日正式发布并开源 Xiaomi OneVL 一步式潜空间语言视觉推理框架。 小米创办人、董事长兼 CEO 雷军昨晚发文谈及了小米自动驾驶模型 Xiaomi OneVL。他表示,Xiaomi OneVL 在业内率先通过潜空间推理,将 VLA、世界模型统一到同一套框架中。 雷军还提到,在推理、规划等多个主流基准上,Xiaomi OneVL 全面刷新了潜在推理方法的性能上限。模型与代码全面开源。雷军最后还向全球开发者、研究人员发出邀请,探索自动驾驶大模型更多可能性。 根据小米技术官方介绍,Xiaomi OneVL 在业内率先实现 VLA、世界模型、潜空间推理等多个技术路线的统一,在具备 XLA 模型强悍推理能力的基础上,大幅提升了推理的速度和精度,是行业内具备开创性的方案,在精度上超越显式 CoT、在速度上对齐“仅答案”预测的潜空间 CoT 方案。 小米已将 Xiaomi OneVL 的模型权重和训练、推理代码全面开源,IT之家汇总链接如下: 技术报告:https://arxiv.org/abs/2604.18486 项目主页:https://Xiaomi-Embodied-Intelligence.github.io/OneVL 开源代码:https://github.com/xiaomi-research/onevl
本文仅展示摘要与 AI 分析。完整原文请点击上方“阅读原文”访问来源网站。