IT之家 10 月 22 日消息,腾讯混元今日官宣,混元世界模型 1.1 版本(WorldMirror)正式发布并开源,新增支持多视图及视频输入,单卡即可部署,秒级创造 3D 世界。
今年 7 月,腾讯推出了混元世界模型 1.0,这是业界首个开源并兼容传统 CG 管线的可漫游世界生成模型,其 lite 版本在消费级显卡就可以部署。
作为一个统一(any-to-any)的前馈式(feedforward)3D 重建大模型,混元世界模型 1.1 解决了 1.0 版本仅支持文本或单图输入的局限,首次同时支持多模态先验注入和多任务统一输出的端到端 3D 重建。
此外,混元世界模型 1.1 还支持额外的相机、深度等多模态先验输入,并基于统一架构实现点云、深度、相机、表面法线和新视角合成等多种 3D 几何预测。
混元世界模型 1.1(WorldMirror)已完全开源,开发者可克隆 GitHub 仓库,按照文档一键部署到本地使用。普通用户也可以直接进入 HuggingFace Space 在线体验,支持上传多视图图像或视频,实时预览 3DGS 渲染结果。
IT之家附开源地址如下: