8月25日,“杭州六小龙”之一的群核科技在首届技术开放日(TechDay)上发布其空间大模型最新成果:新一代空间语言模型SpatialLM 1.5与空间生成模型SpatialGen。据悉,两款模型将逐步在HuggingFace、GitHub、魔搭社区等平台面向全球开发者开源。
SpatialLM 1.5是一款基于大语言模型训练的空间语言模型,支持用户通过对话交互系统SpatialLM-Chat进行可交互场景的端到端生成。
SpatialGen是一款基于扩散模型架构的多视角图像生成模型,可根据文字描述、参考图像和3D空间布局,生成具有时空一致性的多视角图像,并支持进一步生成3D高斯(3DGS)场景并渲染漫游视频。
据群核科技AI产品总监龙天泽介绍,群核科技正在研发一款基于3D技术的AI视频生成Agent(智能体),并计划在今年内发布,有望弥补当前AIGC视频生成中时空一致性不足的问题。
群核科技联合创始人兼董事长黄晓煌在会上谈到开源的价值,“开源是我们战略的重要关键词之一。群核科技从2018年启动开源战略。相比大语言模型,当前空间大模型还处于初级阶段。我们希望通过开源推动空间智能技术快速前进,成为全球空间智能服务提供商。”黄晓煌说。