2025年9月30日,智谱正式发布并开源全新一代大模型
GLM-4.6
。这次更新,重点在
Agentic Coding
等核心能力上实现大幅跃升,既是继 DeepSeek-V3.2-Exp 与 Claude Sonnet 4.5 之后的又一重磅发布,也在国庆前夕为国内 AI 圈投下了新一颗“深水炸弹”。
在最新的公开基准测试与真实编程任务中,GLM-4.6 的
代码生成能力已全面对齐 Claude Sonnet 4
,坐稳国内 Coding 模型的头把交椅。与此同时,它在长上下文处理、推理、信息检索、文本生成、智能体应用等方向全面升级,整体性能
反超 DeepSeek-V3.2-Exp
。作为开源模型,GLM-4.6 更是一举跻身全球开源生态的最强阵营,进一步夯实了国产大模型的国际竞争力。
值得注意的是,智谱宣布 GLM-4.6 已率先在
寒武纪国产 AI 芯片
上实现
FP8+Int4 混合量化推理部署
,这是国内首次落地的
模型-芯片一体化 FP8+Int4 方案
。在不牺牲精度的前提下,推理成本大幅下降,为国产芯片本地化运行大模型提供了可复制的样板。
另一边,
摩尔线程
也完成了对 GLM-4.6 的适配。基于 vLLM 推理框架,新一代 GPU 能够在
原生 FP8 精度
下稳定运行,进一步验证了
MUSA 架构与全功能 GPU 的生态兼容性
。寒武纪与摩尔线程的加入,意味着国产 GPU 已具备与前沿大模型同步迭代的实力。
智谱透露,GLM-4.6 搭配国产芯片的组合将率先通过
智谱 MaaS 平台
对外开放,为企业和公众带来更低成本、更高性能的服务,释放产业和社会价值。未来,随着 GLM 系列与国产芯片的深度耦合,模型训练与推理都将实现
性能与效率的双重突破
,推动形成开放、可控且高效的人工智能底座。