36氪获悉,小米MiMo大模型团队在官方技术博客发布文章,首次完整公开MiMo-V2.5系列大模型API永久降价背后的技术路径。文章称,MiMO-V2.5实现了KVCache双池+SWA-aware前缀树、GCache分布式缓存、KVCache亲和调度、Decode阶段MTP加速、多模态推理优化五大核心突破,降价后仍能维持收支平衡。此外,4月28日推出的“百万亿Token创造者激励计划”,总申请人数超过54万人,累计发放100万亿免费Token,折合人民币超6500万元。
正在拉取原文正文,下次刷新即可看到完整段落。当前仅展示摘要与 AI 分析。
