Technology

面壁智能「开源周」：一场定义端侧 AI 终局的系统性「亮剑」

一场罕见的「技术组曲」。作者丨马晓宁编辑丨林觉民难得能遇到一次大模型开源周。 5 月 25 日至 29 日，面壁智能联合 OpenBMB 开源社区，以每日发布一项关键技术成果的节奏，举办了一场「端侧大模型开源周」。这在中国乃至全球的大模型公司中，都是一次极为罕见的集体「亮剑」。从适配国产昇腾、未来有望将 600 亿参数大模型装进手机的 1.58-bit 低比特训练大模型 BitCPM-CANN，到性能超越两倍参数模型、全球同级最优的 MiniCPM5-1B；从 AI 亲手编写、在 H100 上比英伟达自家大模型训练框架 Megatron 更快的 ForgeTrain，到重构交互范式的智能体操作系统 PilotDeck；最后，再到揭示端侧模型高效智能源头的核心数据集 UltraData 系列…… 这五项成果并非孤立的「技术烟花」，而是一套环环相扣、逻辑严密的「技术组曲」。它们共同指向一个清晰的行业事实：端侧大模型的终局之战，比拼的不是某个单点技术的拔群，而是覆盖数据、算法、框架、应用的全链路系统工程的创新总和。面壁开源周，更迫使我们重新思考：在通往 AGI 的道路上，开源的真正价值是什么？而端侧，又将在其中扮演怎样的角色？ 01 为何开源周如此之少翻开过去三年的历史，面壁之外，也仅有以「效率美学」著称的 DeepSeek 在 2024 年（6月24日-28日）进行过类似的开源周活动。此外，虽然有些公司有过一周开源三款模型的记录，但是还未曾冠以开源周的名义。做“开源周”，通常意味着一个机构需要在短时间内（一周）集中释放大量、系统性的技术成果。这不仅仅是数量的堆砌，更关键的是质量的深度和规划的体系性。无论是DeepSeek，还是面壁的开源周案例，我们可以这样理解：刻意将发布压缩在5-7天内，每天甚至半天就有新项目放出。这需要背后有充足的项目储备和成熟的发布节奏规划。这次面壁的开源，从最底层的 Infra 创新（BMTrain、BitCPM），到数据治理（UltraData），再到模型算法（MiniCPM、VoxCPM）和上层应用（PilotDeck、松果派、法律大模型、智能座舱等），面壁智能的布局并非单点突破，而是围绕「端侧」这一核心目标，进行的前瞻性、体系化构建。云端大模型的核心壁垒在于「规模」，比如更多的卡、更多的数据。而端侧大模型的壁垒则在于「系统性协同」的复杂度。面壁智能的这场开源周，本质上就是一次「完整技术栈的专场展览」。这些开源项目不是孤立的，而是串联了算法层、基础设施层、应用层三个环环相扣的技术层级。开源周让所有人看到，这不仅仅是五个独立项目，而是一套可以复现的、经过验证的、端到端的国产端侧大模型解决方案。五天五连发是开源周的标配，从DeepSeek和面壁的例子来看，单一模型远远不够，而是一套技术栈组合。因为单点开源一个模型可能只是「运气」，但能开源一整套训练-推理-部署-数据工具链，证明了组织具备完整、先进的工程体系能力。如果一家机构技术储备不足却强行「造周」，可能发布的就只有一些维护性更新或文档，第一天期待被拉高后，后面几天质量就呈现除了断崖式下跌的趋势，反而是对口碑的极大损害。从一次开源周上，我们也可以得出这样的结论，能稳定输出「一周成果」，说明内部有多个并行项目处于可发布状态，那么这家公司的研发流程工业化程度也是堪称典范。 02 十年一剑，霜刃可试如果说，开源周的五项发布，揭秘了其在端侧 AI 赛道上深不可测的「内功」，持续的开源，则展现了面壁智能的格局。早在 2022 年，当国内对大模型的认知还普遍处于混沌初开之际，由清华大学 THUNLP 实验室与面壁智能联合发起的 OpenBMB 开源社区，就已开启了中国最早的、全链路的大模型开源探索。同年 7 月，OpenBMB 开源社区推出的免费「大模型公开课」，几乎成为国内第一批大模型从业者的「启蒙教程」，累计播放量达数百万。他们也是国内最早直播大模型训练过程的社区，对培养中国的大模型人才梯队、塑造开放的技术氛围，贡献卓著。这种坚守，也体现在成果的「含金量」上：在 2024 年 Hugging Face 统计全球最受欢迎大模型时，OpenBMB 开源社区的模型下载量位列中国区第一。时至今日，其 GitHub 星标已超过 13 万，位列全球开源组织前一百；MiniCPM 系列模型全球下载量突破 3000 万次，UltraData 数据集下载量也超过 400 万次。这些数字的背后，是全球开发者真金白银的「投票」，也是其开源贡献得到国际认可的最好证明。更重要的是，面壁智能的开源，是一种体系化的、毫无保留的「真开源」。此次开源周，他们不仅开源了模型（MiniCPM5-1B），还开源了模型背后的「生产线」（ForgeTrain）、「核心工艺」(BitCPM-CANN）、「原材料」（UltraData），乃至「智能体操作系统」（PilotDeck）——这在全球范围内都极为罕见。「何为真正的开源精神」，长达数年的持续投入和一次毫无保留的集中展示，这就是开源精神。 03 端侧智能的未来端侧大模型的技术，要求在算法、软件、硬件、数据之间找到一个极致精妙的平衡点。这需要对模型压缩（如 BitCPM-CANN 的1.58-bit QAT）、高密度数据治理（如 UltraData）、软硬协同（适配国产算力）、高效推理框架（CPM.cu）、前沿智能体（PilotDeck）等多个领域都有世界级的认知和积累。这是一个「精工细作」的领域。单点能力的突出，远不如全链路的协同优化来得重要——这道系统性的门槛，是端侧 AI 赛道难以被轻易超越的真正原因。图注：2026 年 5 月，面壁智能新一代「小钢炮」MiniCPM5-1B 的性能就已超越 GPT-4o 的部分版本能力端侧模型正在以惊人的速度，逐步「吞噬」原本属于云端模型的专属能力领地。如果这一趋势持续，整个 AI 行业的底层逻辑将被彻底改写： ▪ 价值链的重构 AI 的核心价值，将从提供云端 API 的公司（如 OpenAI、Google），大规模地转移到控制终端的硬件厂商（如苹果、高通、联想）和掌握端侧 AI「操作系统」的公司。届时，谁能提供最高效、最普适的端侧 AI 解决方案，谁就掌握了下一代计算平台的「灵魂」。 ▪ 应用范式的革命「离线可用」、「零延迟」、「绝对隐私」将不再是奢侈品，而是 AI 应用的基础标配。能够常驻在个人设备中的智能体，将重塑我们与数字世界交互的每一个环节，真正的「数字伴侣」将成为现实。 ▪ 商业模式的颠覆按 Token 计费的模式将被削弱，取而代之的，可能是类似传统软件的授权费，或是与硬件绑定的「一次性买断」。这将极大地降低普通用户使用先进 AI 的门槛，引爆真正的 C 端应用大爆炸。这不仅是一场技术路线的演进，更是一场权力与价值的迁移。而在这场即将到来的地壳运动中，已经领先两年的面壁智能，无疑占据了最有利的战略位置。雷峰网消息

雷峰雷峰网Updated 4h ago1 min read

🤖 AI AI Summary & AI Analysis

⟳ AI is analyzing this article…

Full article body is being fetched in the background. Refresh in a moment to see the complete paragraphs. For now this page shows a summary and AI analysis.