8月24日,埃隆·马斯克在X平台上发文宣布:“@xAI的Grok 2.5模型,是我们去年最好的模型,现在已经开源。Grok 3将在大约6个月后开源。”
这条看似简单的推文,却在AI圈掀起了不小的波澜。毕竟,这可是马斯克,一个从不按常理出牌的科技狂人,而xAI作为OpenAI的挑战者,其每一个动作都牵动着整个行业的神经。
但当我深入了解这次“开源”的细节后,不禁陷入了思考:这到底是一次真正的开源贡献,还是马斯克精心设计的又一场营销游戏?
“虽迟但到”的开源承诺
回顾历史,马斯克在去年8月Grok-2发布时曾公开承诺:“每当创建Grok新版本的时候,就会开源之前的一个版本。”如今,随着Grok-4在今年7月的发布,是时候兑现承诺了。
“虽迟但到”,有网友这样评价。但在这个AI模型日新月异的时代,一年前的“最好模型”还有多少价值?根据知名AI基准测试机构Artificial Analysis的数据,Grok-2的智能指数仅为28分,目前位列第23名,而目前排在前列的分别是OpenAI的GPT-5、Grok-4和o3,分数分别为69、68、67。
技术参数:一个“巨无霸”模型
根据官方公布的信息,Grok 2.5模型包含42个文件,总大小约500GB,需要至少8块GPU(每块超过40GB显存)才能运行。这种硬件门槛,直接将大多数个人开发者挡在了门外。
从技术架构来看,Grok 2.5基本上延续了Grok 1的设计思路:
Grok系列模型技术参数对比
“假开源”的真相
当我深入了解Grok 2.5的开源协议后,一个词汇浮现在脑海——“假开源”。
严格限制的“社区许可”
与DeepSeek、Qwen等采用MIT或Apache 2.0协议的开源模型不同,Grok 2.5采用的是“Grok 2 Community License”(社区许可)。这个协议的限制之多,让人不禁怀疑这是否还能称之为“开源”。
根据协议条款:
这种限制,与真正的开源精神相去甚远。开源的核心理念是自由使用、修改和分发,而Grok 2.5的"开源"更像是一种有条件的"租借"。
真正的开源是什么?
让我们看看其他主流AI模型的开源情况:
主流AI大模型开源协议对比
从表中可以看出,Grok 2.5的开源限制是最严格的之一。相比之下,OpenAI今年8月推出的gpt-oss-120b与gpt-oss-20b模型,采用MIT协议,不仅性能堪比o4-mini和o3-mini,甚至可以在高端笔记本和手机上运行。
马斯克的开源逻辑
那么,马斯克为什么要推出这样一个“假开源”的模型?
从战略角度看,这其实是一种精心设计的商业策略:
正如一位业内人士所言:“马斯克是懂开源的,因为他虽然开源了,但是开源的都是几乎无用的模型。”
AI战争的新战场:能源与硬件
在宣布Grok 2.5开源的同时,马斯克还发表了一个引人深思的观点:“xAI很快就会超越除谷歌外的任何公司,然后也将超越谷歌,但中国公司将是最强劲的竞争对手,因为他们的电力比美国多得多,而且在硬件建设方面实力超强。”
这句话揭示了AI竞争的本质正在发生深刻变化。
从算法竞赛到基础设施竞赛
早期的AI竞争主要集中在算法创新上,谁能设计出更高效的模型架构,谁就能占据优势。但随着技术的发展,算法创新的空间逐渐缩小,竞争的焦点正在转向更为基础的层面——能源供给与硬件制造能力。
Grok 3的训练就是一个典型例子。这款模型在孟菲斯超级集群上完成训练,使用了由10万块英伟达H100 GPU组成的Colossus超级计算机,总训练时长达到2亿GPU小时,计算量较前代模型Grok 2提升10倍。目前,这个集群已经扩展到20万块GPU,未来计划扩展至100万块。
这种规模的算力需求,背后是巨大的能源消耗。据估计,训练一个像Grok 3这样的大型模型,消耗的电力相当于一个小城市几年的用电量。
AI竞赛的三个维度
当前的AI竞赛,实际上在三个维度上同时展开:
AI竞赛的三个维度
在这三个维度中,算法创新的重要性正在相对下降,而算力规模和能源供给的重要性正在快速上升。
Grok系列的技术演进
Grok系列模型的发展,折射出xAI从成立到崛起的轨迹:
Grok系列模型发展历程
作为xAI目前的旗舰模型,Grok 3在技术上有多项突破:
在基准测试中,Grok 3表现优异:
今年7月发布的Grok 4更是将xAI的技术实力推向了新高度:
这种表现,已经超越了人类专家在多个领域的水平,难怪马斯克如此自信地宣称xAI将超越所有竞争对手。
根据xAI的路线图,未来几个月还有多项重要发布:
而Grok 3的开源计划,预计将在大约6个月后实施。如果按照Grok 2.5的模式,届时我们可能会看到一个技术上已经相对落后,但仍有一定研究价值的模型被“有限度”地开源。
开源的双重面孔
Grok 2.5的“假开源”现象,反映了当前AI行业开源运动的双重面孔:
一方面,开源确实推动了AI技术的民主化。从早期的TensorFlow、PyTorch,到后来的LLaMA、DeepSeek,开源模型降低了AI技术的使用门槛,让更多中小企业和个人开发者能够参与AI创新。
另一方面,开源正在被一些公司用作营销工具。通过有限度的开源,既获得了开源的声誉,又保护了商业利益,这种做法正在变得越来越普遍。
AI时代的开放与封闭
作为一个长期关注AI发展的观察者,我对Grok 2.5的“假开源”现象有着复杂的感受。
一方面,我理解商业公司的考量。AI模型的研发成本极高,动辄数亿甚至数十亿美元的投入,完全开源确实不太现实。而且,在激烈的市场竞争中,保持一定的技术优势也是必要的。
另一方面,我又担心这种“伪开源”会损害开源运动的公信力。
马斯克的Grok 2.5开源,像一面镜子,照出了当前AI行业的种种现象:技术的快速迭代、商业利益的博弈、开源理念的异化、国际竞争的加剧。
Grok 2.5的“假开源”或许不够完美,但它至少提供了一个讨论的起点。随着Grok 3在6个月后的开源计划,以及xAI更多的技术发布,AI行业的开源与闭源之争还将继续。
下一篇:马斯克旗下大模型开源