字节跳动商业化技术团队近日正式开源了面向视频生成与视频编辑的统一框架——Bernini。该框架核心主打“先理解、再生成”的协同机制,旨在解决传统模型因无法精准理解复杂文本指令而导致画面失控、帧间闪烁等行业痛点。 Bernini 将工作流拆分为“语义规划”与“视觉渲染”两部分。系统首先通过多模态大模型规划器(MLLM-...

正在拉取原文正文,下次刷新即可看到完整段落。当前仅展示摘要与 AI 分析。