昆仑万维宣布开源 Matrix-Game大模型
创始人
2025-05-13 10:46:14

IT之家 5 月 13 日消息,昆仑万维刚刚宣布 Matrix-Game 大模型(17B+)正式开源,即 Matrix-Zero 世界模型中的可交互视频生成大模型。

昆仑万维表示,Matrix-Game 是 Matrix 系列在交互式世界生成方向的正式落地,也是工业界首个开源的 10B+ 空间智能大模型,它是一个面向游戏世界建模的交互式世界基础模型,专为开放式环境中的高质量生成与精确控制而设计。

据介绍,Matrix-Game 包括三大核心:

  • Matrix-Game-MC 数据集:自主构建的大规模交互世界数据集,包含两类数据:一是大规模无标签的 Minecraft 游戏视频,二是带有键盘与鼠标控制信号的 Minecraft 与 Unreal 可控视频数据,具备精细的动作注释。该数据集支持对复杂环境动态与交互模式的高效建模与学习。
  • Matrix-Game 主模型:基于先进扩散模型技术开发的图像到世界生成框架,能够根据用户输入(键盘指令、鼠标移动等)生成连贯、可控的互动视频,兼顾视觉质量、时序一致性与物理合理性。
  • GameWorld Score 评测体系:提出统一的游戏交互世界评估标准,从视频的视觉质量、时序质量、动作可控性与物理规则理解四个维度,全面量化模型性能,填补了该领域缺乏系统性评测基准的空白。

Matrix-Game 能够在不同 Minecraft 场景下(如森林、沙滩、沙漠、冰川、河流、平原等)实现可控生成,包括基础运动、复合运动、视角运动等。例如,在一个沙漠场景中,Matrix-Game 能够根据用户输入的任意控制指令(IT之家注:如键盘的 W / A / S / D 方向键、Space 键用于跳跃、Attack 键用于攻击,以及鼠标用于视角移动),生成对应的游戏世界视频,支持角色的前后左右移动、跳跃、攻击以及视角变换等动态行为。

在此基础上,Matrix-Game 支持自回归式的长视频生成,不仅能实现动作与视角之间的丝滑衔接,还在时间一致性与环境适应性方面表现出色,为开发沉浸式长时体验、创意内容生成及游戏设计等应用奠定了坚实的模型基础。

参考资料

  • 项目主页:https://matrix-game-homepage.github.io
  • 技术报告:https://github.com/SkyworkAI/Matrix-Game/blob/main/assets/report.pdf
  • GitHub 开源地址:https://github.com/SkyworkAI/Matrix-Game
  • HuggingFace 开源地址:https://huggingface.co/Skywork/Matrix-Game

相关内容

热门资讯

AI助力阿尔茨海默病治疗突破 你知道经常吃鸡蛋可能有助于保持老年时期的头脑敏锐吗?或者阿尔茨海默病实际上与神经元周围的髓鞘退化有关...
开源 AI 及其在当今世界中的... 当团队准备部署大语言模型时,他们面临一个重要选择:是否向全世界公开系统的运作机制,包括参数、训练数据...
北京一副区长停“小电驴”遭“三... “没地停了”“这不让停”“人行通道不能停”……近日,北京一副区长实地体验早高峰停放电动车却遭遇“三连...
打字就能补全句子,讯飞推出个性... 2025科大讯飞全球1024开发者节AI文娱生态战略发布会近日在合肥举办。会上透露,讯飞AI文娱将基...
对话华为樊杰:AI落地浪潮下的... 随着大模型的规模落地,AI发展的主战场正从“模型训练”转向“行业推理”,解决推理效率瓶颈成为释放AI...