马斯克在 X 上透露 SpaceX 团队已基本完成 V1.0 版本的自研 AI 训练栈开发。这套新系统以 C 语言编写,精确适配 22 万块 GB300 GPU 集群和 800G 网卡配置,在设计上大量采用流水线并行化,目标是尽可能接近裸金属性能。他给出的预期性能提升数字是:大规模训练任务相比 JAX 提速一个数量级以上。 这个信息的分量需要从几...

正在拉取原文正文,下次刷新即可看到完整段落。当前仅展示摘要与 AI 分析。