近日,全球领先的通用人工智能公司VAST宣布完成A+及A++两轮融资,合计近2亿美元。 本轮融资由渶策资本、国寿长三角科创基金领投,深圳市人工智能终端产业基金(产业方为全球头部终端厂商荣耀)、知名产业战投、上海半导体产投等产业投资方,深创投、元生资本、沃赋创投与方广资本等一线财务资本联合投资,投资方汇聚头部市场化基金、国资平台与产业龙头战投,形成多元赋能体系;同时,春华创投、靖亚资本、BV百度风投、东方嘉富等老股东亦持续超额追投。 这是 VAST 继今年 3 月融资后,时隔两月再度获得资本加持。 与此同时,VAST 揭晓了全新的世界模型项目——Project Eden。 区别于业内“动作条件视频生成”与“静态 3D 场景生成”等常规路径,Project Eden 创造性地将底层状态推演与视觉呈现进行了原生解耦。这一突破使它成为全球首个允许对世界状态进行自主维护与确定性控制的世界模型,并自然解锁了环境长程持久、场景自由复用、多人并发交互等颠覆性能力。Project Eden 旨在成为下一代低门槛交互式内容创作的底层引擎,同时能够为具身智能等智能体提供具备高逻辑一致性的训练与评测环境。 本轮资金将主要用于 AI 3D 大模型、通用世界模型的顶尖人才引进、核心算法迭代与数据沉淀,同时加速全球市场布局与产业生态构建。此次融资,既是资本市场对 VAST 技术路线与商业化成果的认可,也凸显出产业界对通用世界模型长期价值的充分肯定。 01 Project Eden,一个环境永续、多人互动的世界模型 大语言模型负责预测下一个单词,视频模型专注渲染下一帧画面,而世界模型的核心使命,是推演世界的下一个状态,即基于现有环境与用户动作,模拟世界随之产生的全部变化。 这也决定了,一套合格的通用世界模型,必须同时解决两大核心命题,第一是定义世界当下的客观状态(State),第二是驱动世界持续自主演化(Transition)。 对 VAST 而言,我们所有技术布局的终极目标始终如一:让每个人都能亲手创造、自由探索无数个可交互的世界。 想要实现这一目标,我们必须攻克几大底层难题:环境长程记忆、多人与智能体并发交互、在工程上能够低成本且可规模化落地。 目前业内主流的两条技术路线,现阶段无法同时满足用户创造世界、并在其中持续交互的完整需求。 第一种是动作条件视频生成:该方案仅根据有限空间的输入动作在像素层面做短时画面预测,将世界状态隐性压缩至有限帧画面内。一旦物体脱离相机视野,模型只能凭空推演重构,无法实现长时序状态留存,也难以支撑多人在同一世界中的协同共存; 第二种是静态 3D 场景生成:这类方案能够搭建可供游览的三维空间,但剥离了时间维度与物理运行逻辑,不存在状态迭代机制,无法支撑动态交互。 基于此,VAST的通用世界模型研究项目 Project Eden,创新性采用三层解耦式技术架构,跳出像素生成的固有桎梏: 底层为结构化状态层:搭建可长期演化的 3D 底层基座,统一维护场景几何结构、物体身份属性与全局事件逻辑,全权承载世界的客观状态与自主推演; 中间为条件接口层:作为状态与渲染的转换枢纽,依据不同相机视角,将完整的底层 3D 状态,转化为适配生成任务的语义、几何条件约束。所有视角渲染均同源同一底层世界,从根源上保障跨镜头、跨视角的物理一致性; 上层为生成式渲染层:依托底层客观状态与中间层约束条件,按需实时渲染精细化视觉画面,补足动态细节,面向用户输出直观的沉浸式体验。 依托状态推演与视觉渲染的原生解耦架构,Project Eden 在全球范围内率先将世界状态转化为可长效留存、反复编辑、多人共享的独立运行体,因此自然解锁了传统方案无法兼顾的三大核心能力: 1. 环境长程持久:世界状态独立于相机视角并永久存储,不受画面切换、用户离场影响。依托底层状态查询保障时空一致性,支持用户在场景内长时间连续漫游,彻底解决物体消失、场景畸变等行业问题; 2. 场景自由复用:支持对世界底层状态进行读写与动态干预,用户在场景内的所有行为都会被真实留存。例如用户对场景物体做出破坏、改造等操作后,后续进入该场景的其他用户,均可看到完全一致的变更结果。无需重复生成场景,实现全域状态延续与高效复用; 3. 多人交互并发:状态演化与渲染流程相互解耦,单一底层世界可同时承载大量真人用户与 AI 智能体多并发在线交互。区别于传统方案算力随视角 / 人数指数增长的弊端,本架构算力成本可控,不仅支撑大规模社交互动、大型在线内容生态搭建,更是集群式具身智能训练、多智能体协同研究的关键底座,商业与科研价值突出。 Project Eden 的定位为下一代交互式内容创作的底层引擎,同时也是适配具身智能训练的高质量仿真基座,可全方位覆盖互动内容与科研两大核心场景: 面向互动内容,提供环境生成和交互逻辑构建的一站式能力,既支持大众创作者以自然语言、简易动作一键创作可多人共享的互动世界,亦服务游戏、影视、VR/AR、数字孪生等行业的内容生产与互动体验落地; 面向科研领域,提供具备完整物理规则、长时序一致性、可自由干预的仿真环境,赋能具身智能的大规模训练与多智能体性能评测。 我们确立了更加务实、可规模化的行业研究范式:拒绝将世界模型降级为视频生成任务,以可演化结构化状态为底座,以生成式模型驱动高保真视觉呈现,路径贴合技术本质,更易规模化落地。 VAST对通用世界模型的探索仍在持续迭代: 一方面强化高复杂度场景推演能力,丰富物理动态效果,拓宽自由视角边界,细化物体交互颗粒度; 另一方面搭建专属状态转移模型,实现底层世界根据智能体交互行为自主更新闭环,并持续优化实时渲染性能、降低落地成本,让世界模型惠及更多创作者与开发者。 想要了解更多技术细节与最新研发动态,欢迎访问:tripo3d.ai/research/project-eden 02 不断刷新 3D 大模型 SOTA,与行业拉开代际差距 过去三年,VAST 在 AI 3D 领域持续稳居算法 SOTA。VAST 自研的 Tripo 系列 3D 大模型,每一次迭代均成为全球行业标杆。 2026 年 3 月正式上线的 Tripo H3.1、Tripo P1.0 模型(NEXUS, SIGGRAPH 2026)持续保持行业断层式领先:前者以雕塑级几何细节刷新了 AI 3D 的精度天花板;后者是全球唯一能够在数秒内输出生产级网格的 3D 大模型,较市面其他方案提速百倍,技术路径代际领先。模型层的持续突破,让 VAST 具备了将 3D 资产从“可看”推向“可用、可交互、可演化”的底层条件。 VAST 的算法迭代还在加速。近期,我们在 Tripo Studio 上线了两项新的算法突破: 8K 贴图:每一个细节都经得起审视 Tripo 8K 贴图是业内首款原生 8K AI 贴图算法。 新的 AI 贴图精度已然突破人眼分辨极限,让 3D 资产实现全距离无损呈现:近距离特写无破绽,极致放大仍然清晰。依托该算法,3A 渲染画质与电影级细节,均可由 AI 原生呈现。 长久以来,8K 贴图一直是高端 3D 资产的专属配置。资深贴图师手工绘制需 3 至 5 天,实地扫描材质并投射至模型也耗时 2 至 3 天,且对设备、场地要求严苛,单张成本高达 500-2000 美元,仅头部项目能够负担。 VAST 将整套制作流程压缩至 2 分钟以内,单张边际成本近乎为零。独立创作者与小型工作室得以轻松获得影视、3A 级别的贴图画质;对于大型团队,高清贴图的产能瓶颈被彻底释放,可随取随用。 技术层面,该功能采用原生多通道同步生成,全维度材质均达到 8K 分辨率,画面纤毫毕现,放大后细节依旧完整。产出资产可直接接入 Unreal、Unity、Blender 等专业工作管线,无需二次修复。 Segmentation V2:更精准、更可控的智能部件拆分 2025 年 5 月,VAST 在 Tripo Studio Beta 上线了业内首个智能部件拆分功能,AI 3D 资产自此可以在生成后自动分件、直接进入下游管线。 Tripo Studio 广泛服务于游戏、3D 打印、工业设计、虚拟现实等各行各业,但不同场景对拆分颗粒度的要求差异显著。用户使用历史版本时,往往需要再次耗费精力手动调整,拉低整体制作效率。时隔一年,我们推出迭代版本智能部件分割 V2,依托升级后的多模态 3D 结构理解模型与部件命名映射机制,打造精度更高、操控性更强的 3D 资产拆分能力。 升级后的 V2 可以实现在执行 3D 拆分之前,会先生成 2D 预拆分图供用户预览,让结果清晰可见;同时引入三档颗粒度控制,对应不同下游场景对装配粒度的真实需求: • 低 Low(3–6个部件):面向 3D 打印、概念展示等以主体结构为主的场景; • 中 Medium(6–15个部件):对应游戏开发与影视制作管线中常见的装配件粒度; • 高 High(15+个部件):面向精细模组、机械结构、可拆卸玩具等高度细分的资产。 对于 3D 打印行业而言,结合同期上线的快速补全(Quick Cap)功能,“生成—分件—补全—打印”的全流程被进一步压缩。 引领前沿研究,共建开源生态 在 VAST,开源不是技术外溢的附属选择。3D 作为人机共通的空间语言,其底层基础设施,理应在公开协作中搭建。 2024 年 3 月,VAST 携手 Stability AI 联合开源 TripoSR,率先将单图 3D 生成速度压缩至 0.5 秒级别,该模型迅速成为全球创作者的主流选择。 2025 年 3 月,我们推出第二季开源计划,陆续释放 TripoSG、TripoSF、UniRig、HoloPart 等八大项目,覆盖从基础模型到功能组件的全核心链路。多款成果已接入 Blender、ComfyUI 等主流创作工具,其中 UniRig 稳坐全球3D 自动绑骨开源方案的标杆位置。 如今,VAST 第三季开源计划正式收官。本季我们聚焦动态互动内容,深挖表征形式与落地场景的全新可能: • 与清华大学联合开源 TripoSplat(DeG, SIGGRAPH 2026):革新 3D 高斯密度控制逻辑,采用可学习概率采样机制,让模型自主完成算力动态调配,使3D 内容不再局限于静态解析度,而是能根据设备、应用场景灵活适配的 “动态分辨率”; TripoSplat在光效表现、透明材质上有得天独厚的优势 • 与香港大学联合开源 AniGen(SIGGRAPH 2026):单图一键生成可动画 3D 资产,在统一模型内完成几何、纹理、骨架与蒙皮生成,让 3D 内容实现生成即可动态交互; • 与清华大学联合开源 SkinTokens:业界首次将蒙皮权重转化为 Token 形式,在同一自回归框架下完成骨骼与蒙皮联合生成,推动 AI 自动绑骨能力达到动画、游戏行业工业级标准; • LegoACE(SIGGRAPH Asia 2025):支持文本、图像双输入,逐块自回归生成可物理拼装的乐高模型。 历经三年深耕,VAST 搭建了完整的 AI 3D 与世界模型开源算法生态体系,累计对外开源项目超 30 个,覆盖从基础表征到生成管线的完整技术栈。持续向全球研究者与开发者开放核心技术,让前沿技术真正服务每一位创作者。 欲了解更多研究项目、洽谈学术合作或有志加入,欢迎访问:tripo3d.ai/research 持续降低创造世界的门槛,让更多人拥有对互动内容的选择权与体验权,是 VAST 三年来所有技术、产品、生态与商业决策的出发点。 《创世记》里,人类因偷食禁果被逐出伊甸园。 整个西方文明叙事的开端,是一次人类的好奇心被惩罚——在创世之初,求知本身就要付出代价。 Project Eden 想要改写这个开端:世界可以拥有成千上万座花园,朝着无需批准的方向恣意生长,结出无数种果实,等待所有人采摘和品尝。 阿根廷作家博尔赫斯在小说《小径分岔的花园》中,同样描绘过一座时间迷宫:时间不断分岔,所有人生与世界的可能性在其中并行共存。 VAST 正在为拥有无数分岔的花园培育土壤、播撒种子,这座花园没有围墙。 VAST 是一家全球领先的通用人工智能公司,致力于通过 AI 3D 大模型及世界模型的前沿算法研究和应用落地,引领普惠的创造平权,使全球每个用户都能创作、体验、交互高质量的空间内容。 公司已打造“自研 3D 基础模型及世界模型 + 一站式原生工作台 + 生态应用”的端到端的产品矩阵,同时依托顶尖的算法团队和海量的高质量空间资产,让 AI 真正走向空间理解、物理推演与现实生产。 VAST 的模型和产品已广泛服务全球个人及企业级用户,持续拓展智能制造、互联网科技、具身智能、互动文娱、情绪消费等各个关键领域,深度赋能千行百业,成为推动新质生产力落地的重要力量。(雷峰网雷峰网雷峰网)
Full article body is being fetched in the background. Refresh in a moment to see the complete paragraphs. For now this page shows a summary and AI analysis.
