AI帝国的飞轮:聊一聊英伟达垄断背后的新逻辑……
创始人
2025-03-26 08:50:22
0

图片 | 来自网络

原创整理 | TOP创新区研究院,FTA Group

转载引用请注明出处。内容仅供交流学习,不做任何商业用途,不代表任何投资建议。

如有侵权请联系后台删除。

每年三月中下旬,GTC的开发者大会,早已变成科技圈的“AI春晚”。这时候,英伟达CEO黄仁勋总会身披标志性的黑皮衣登场,讲讲接下来一年算力世界的剧本。

今年的春晚,英伟达发布了 Blackwell Ultra AI芯片,性能比上一代有显著提升,预计在2025年下半年量产;又甩出了下一代 Rubin GPU平台,定档2026年亮相,连带着2027年的Rubin Ultra和2028年的Feynman,三年路线图一口气铺开,摆明了要锁定未来AI市场;还有机器人领域的重磅—— Isaac GR00T N1开源模型,号称要让机器人也能像人一样干活。

从芯片到软件再到机器人,英伟达是要把AI时代的基础设施牢牢垄断在自己手里。

而这,才是真正的重点。

因为这个“垄断”,跟我们过去理解的那种垄断——靠价格、靠封锁、靠行政,甚至靠平台——都不一样,它靠的是“最优路径诱导”,让整个生态系统主动滑进它定义的轨道。

那么问题来了:

AI时代的现代垄断结构,究竟长成什么样?

它是怎么搭起来的?又有没有可能被打破?

这篇文章有点长,

我们不聊皮衣、不聊技术,就聊聊背后那套系统结构的控制逻辑。

ChatGPT背后

不只是9万美元一颗的芯片

ChatGPT每一次输出、大模型每一次训练背后,都离不开那一块块价值高达9万美元的英伟达芯片。

但,如果我们仅仅将英伟达的成功归因于“性能领先”,未免过于肤浅—— 这就像以为罗马帝国之所以强大,仅仅是因为士兵更高大,而忽略了其隐秘而强悍的制度性结构。

真正让英伟达建立起垄断飞轮的,不是芯片本身,而是它在2006年推出的 CUDA 编程平台。

表面上,它只是为了方便程序员在英伟达GPU上写代码。

但其实,它是一种生态系统的种子代码。

其中最关键的“种子”种在了2016年,那年还是非营利机构的OpenAI接收了英伟达的捐赠,这是“世界上第一台专为人工智能设计的超级计算机”,其核心组件包括8个 基于Volta架构的V100 GPU。

当然,这只是一笔区区12.9万美元的技术赞助。

但是,命运的齿轮开始转动了。

几年后,GPT系列成功,行业标准也就被写进了CUDA的语法里,训练流程、算子接口、资源调度,全都围绕CUDA 构建。

OpenAI的胜利路径,很快成为整个行业的“默认路径”。

全球AI创业者和实验室纷纷接入CUDA,不是因为它最便宜、最优越,而是它最“主流”、最兼容OpenAI的成功方式。

英伟达好风凭借力,在AI崛起的关键时刻,

也悄然将CUDA从“选项”变成了“标准”。

而CUDA和其衍生工具(如PTX、Run:AI、Omniverse)构建的已不只是工具链,而是一套从底层执行逻辑到上层调度策略的完整操作系统。

一旦你使用CUDA,就必须用其编译器、遵循其张量并行模型设计;用Run:AI,就必须在其定义的资源调度规则中优化算力;用PTX,就要接受其底层线程分配和执行方式。也就是说,从底层硬件编程到上层应用开发、调试、优化以及集群管理的各个层面, 都由英伟达定义。

今天的CUDA不再是工具,而是一整套控制结构。

英伟达控制的不是某个产品,而是整个AI工程世界的“运行方式”。

如果在Windows 平台下运行 AI 框架,Nvidia 控制的是“中间三层”,AI软件栈最核心的执行与接口层,图源:docs.nvidia.com

这就好比微软当年用Windows控制PC行业。你可以换键盘、换鼠标,换不了操作系统。

同理,在AI时代,你可以换厂商,但你绕不过CUDA的接口。

经济学上有个经典的说法:

“当一个生态的迁移成本远高于留存成本时,生态就被锁定了。”

这正是CUDA厉害的地方——它让用户产生了路径依赖,而且这种依赖不再只是硬件层面的“兼容”,而是把整个AI工程师的思维方式全都吞进了自己的结构中。

四大巨头

互锁成超级飞轮

而且,这不仅仅是英伟达一家的垄断,而是四家公司共同织就的闭环——

一个看似分工明确,实则层层反嵌的超级生态飞轮。

当然这场飞轮的核心是英伟达。

它本身并不生产芯片,却定义了芯片。设计权掌握在它手中,制造则交由台积电(TSMC)完成。

台积电是这个生态的物理中枢,全球95%的先进AI芯片出自台积电,仅来自英伟达的订单年收入就高达76亿美元。

如果说英伟达是战场上的战略指挥官, 那TSMC就是唯一的军工厂。

而芯片性能要真正释放,还得靠海力士(SK Hynix)提供的高带宽内存(HBM)。海力士长期生存在三星的阴影下,但幸运地凭借2019年突破性的封装设计,解决了AI训练的过热瓶颈问题,一跃成为AI内存唯一的王者。现在它和英伟达是命运共同体:海力士超过80%的HBM3E配给英伟达,而英伟达有接近一半的GPU依赖海力士封装,谁也离不开谁。

再往上溯,就是给军工厂提供装备的ASML——全球唯一能造出EUV光刻机的荷兰公司。这玩意儿一台3.8亿美元,贵过波音飞机,只有ASML能造TSMC一年有13%的资本支出砸在它身上,ASML赚了钱,再反哺TSMC升级产线。

彭博供应链分析根据财报数据画过一张图,图中,微软、亚马逊、谷歌是金主,把巨额资金倒进英伟达换GPU,比如,微软将近一半的资本支出都花在了购买英伟达的 GPU 上,英伟达再把钱给台积电、SK Hynix造芯片,台积电拿到钱又去找ASML买设备,ASML再把利润用来做更先进的研发。

这四家公司看似独立,却是彼此交错、相互嵌套,每一个节点既是依赖者,也是控制者,看似互补,实则互锁,

是一种资本耦合 + 系统锁定的“高频共振结构”。

这也是英伟达跟Intel的根本区别:

Intel是传统制造商,一体自研自产;英伟达是“超级Fabless”玩家,不碰生产,只靠架构设计和接口标准,把全产业链反绑在自己定义的结构上, 它不拥有任何工厂,却控制了工厂的运行逻辑。

财务数据上,英伟达、TSMC、ASML 和SK Hynix四家公司合计市值已超过4万亿美元,相当于一个法国的GDP总量, 英伟达一家便占了标普500指数的约6%。

你以为只是买了ChatGPT的会员,

实际上你是在资助一个结构型垄断系统。

越想逃离

越被绑定

此外,我们也看到了一个令人迷惑的现象:

一方面,越来越多的大厂对英伟达怨声载道:芯片贵、交付慢、不透明,

纷纷表示要逃离英伟达的垄断:比如微软在扶持AMD,让它开发MI300加速器;亚马逊投入自研的Trainium芯片;谷歌则靠TPU体系试图构建自己的飞轮。

但另外一方面,我们看到大厂们加码投入、疯狂抢购GPU,采购量一个比一个狠,部署速度一个比一个快。

为啥会这样?

其实答案很简单:

去依赖=换系统。

而换系统,不是换个供应商这么轻松,是一场整体系重构。

你要换芯片?那训练框架要重写,算子调用要重构,资源调度要改,工程师要重新培训,连数据中心的冷却方案都可能推倒重来。

这不是从A切到B,这是从高铁退回驴车,甚至轮子都要重新造。

那请问,在切换的时候,你就能让自己原来那套体系突然“嘎”了?

当然不能!因为所有的竞争者还在用原来的系统,为了不落后,你一边“逃离”,一边还得“加码”。

这样一来,你要花三倍甚至十倍的成本去维护“两套系统”,以确保过渡期“不断电”,确保没有算力不足、部署延迟、竞争落后等问题,确保自己仍然在牌桌上。

所以在短期内,看上去你在摆脱英伟达,实则这个逃离的过程反而制造了更大的短期算力需求,更强的性能保障焦虑,于是,买得更多、部署得更深、绑定得更紧。

赫希曼在其经典著作《退出、呼吁与忠诚》里早就讲过这类困局: 当退出的代价高于留下的痛苦,大多数人会选择原地踏步。

而像英伟达这种垄断,不靠行政命令维持,而是靠“退出的痛”自我加固。

现在这些科技公司不是“还没意识到被垄断”,而正是“越清醒,反而越深陷”。因为他们知道,真正危险的不是现在买英伟达, 而是“现在不买英伟达、但还没准备好替代系统,先死在了半路上”。

从某个角度来讲,这甚至不是商业层面的策略,

而是技术资本主义垄断的一种宿命:

19世纪末到20世纪,工业时代。我们看到钢铁大王、铁路大亨、石油帝国,这一阶段是 “集中资产控制”——

企业要实现垄断地位,要不有工厂(产能)、要不有石油、钢铁(资源)、要不有铁路(物流),这是物理控制的逻辑。

到了个人电脑与互联网时代,平台开始兴起,比如微软的Windows,谷歌的Search,Apple的iOS生态,谁离用户近,并且能 控制用户的接口与体验,谁就能获得垄断地位, 这是认知接口的控制逻辑。

第三阶段,也就是现在的英伟达, 进入了“结构执行层控制”阶段:

它不控制用户,也不控制制造,但它定义了系统怎么跑、怎么调度、怎么构建。

这正是英伟达所在的新垄断维度——

英伟达只是告诉你一条“最快的捷径”,然后你就自动滑入它设好的轨道,甚至忘了,自己曾经有过选择权。

这才是AI科技帝国的统治方式,不是强迫你跪下,而是让你自己走进笼子,再反锁门。

三条路径

用系统对抗系统

面对英伟达主导的算力帝国,任何一个挑战者,其目的不是搞出一个性能对标、价格更低的替代品, 而是需要花时间,从底层建一套逻辑不同、结构可控、自我进化的新系统,而且系统之间的各个要素得协调得起、撑得住、滚得动。

对于中国而言,受限于芯片供应链的“卡脖子”困境,我们被迫承担起这个“挑战者”的角色。

诺贝尔经济学奖得主、心理学家和计算机科学家赫伯特·西蒙讲过“近似可分系统Near Decomposability”这个概念:

越是复杂系统,越要靠松耦合的模块拼起来;越是追求一体化,越容易崩,只有系统之间“松绑但不脱钩”,才能抵御结构性冲击。

自然界和人类设计的系统都倾向于通过 模块化和松耦合来应对复杂性。

这个概念,也正是中国版AI系统最该吸收的底层智慧。

我们的机会不在“赢在一个环节”,而在“织出一张网”,这张网要从芯片设计,到制造工艺、从内存封装,到软硬结合,再到模型训练,一路延伸到平台部署与行业应用。

这不是一个点挑战中心,而是一群子系统各自自转、彼此勾连。

而在目前,我们能看到了三种雏形,

每一种都是一条不同的挑战路径:

第一条,算法调度型突围,

代表是DeepSeek。

DeepSeek不靠最强芯片,而是通过算法优化来弥补差距:改PTX指令、压缩训练流程、适配旧GPU,用软件弥补硬件短板。

当然,这不是靠预算堆出来的,而是用工程师精神撕出结构缝隙的打法。

咱们可以理解为“软件定义算力”:不是谁家芯片跑得最快,而是谁能把现有算力榨到极致。

这种路径的优势在于跨平台适配能力强,尤其适合资源受限但需求刚性的市场,如中小企业或特定行业应用。

第二条,生态一体化路径,

代表是阿里与百度。

阿里和百度走的不是单点“出奇制胜”的路线,而是在打造一个从算力到应用的完整闭环。它们提供端到端的解决方案:从算力到训练平台,从API到企业部署,全部打包好,用户点一点就能用。你不需要理解模型结构,不需要知道是哪块GPU在算,结果能跑出来、能上线就行。

这种“系统即服务”的模式类似于水电煤气的普及化逻辑——

企业不再关心底层技术,只关注效率提升和成本节约。如果说英伟达通过CUDA统治了“工程师接口”,阿里和百度则瞄准了“用户接口”,英伟达面向开发者,我们则服务于用户。这种路径的潜力在于快速渗透千行百业,构建用户粘性。

第三条,底层协同式链路,

代表是寒武纪、中芯、昇腾等组合

这一路径不追求短期内对标英伟达H100的极致性能, 而是聚焦于打造一套90%性能+100%可控的“本土系统”。例如:寒武纪:专注于AI芯片设计,其NPU在国内特定场景已有应用;中芯国际:作为制造环节,其工艺目前以14nm为主,7nm刚起步,能满足中端需求;昇腾:华为的AI芯片(如昇腾910B)搭配CANN(Compute Architecture for Neural Networks)软件框架,形成较完整的软硬一体生态。

这一组合的优势在于链条短、可控性强,避免关键环节断供,适合政务、工业、城市管理等本土刚需场景,可以将其视为中国版的“备用操作系统”——不求与英伟达正面交锋, 但能在关键时刻自给自足、不掉线。

这三条路径,不是平行赛道,而是三种结构逻辑,可以混合搭建。

真正的目标,不是用它们哪一条“打败英伟达”,

而是能不能用它们共同织出一个结构有弹性、产业有冗余、路径有替代的新飞轮。

因为只有能主导系统的,

才是真正的帝国。

我们总在问谁能造出更强的芯片。但真正决定游戏规则的,从来不是跑得最快的人,而是那个能画路线图、建规则本、定义接口标准的人。

英伟达靠的不是资产,而是结构。

然而,结构可以是钥匙,也可以是锁链。

我们可能推不倒旧飞轮,可能“造不出另一个英伟达”,但我们可以——

把结构打碎重构,用另一套结构,另起一个飞轮。

▼ 点击下方关注TOP创新区研究院(TOP_Lab)

看完想跟我们交流互动?

欢迎扫码加入TOP读者群

二维码只存续到3月30日

如果二维码失效,请后台回复“入群”

扫描最新二维码,期待群里见到您❤️

创新区研究,就在TOP研究院。

TOP Lab (TOP创新区研究院) 是 FTA 的创新研究引擎,专注于为城市、企业和 园区提供系统化的前瞻洞察与战略建议。基于Talent(⼈才)、Organization(组织)、 Place(区域)三⼤核⼼维度,TOP致⼒于探索全球创新区的发展规律,并结合本⼟实践,为区域发展和企业创新注⼊新的价值维度。

FTA Group:用技术和艺术引领未来。

FTA Group致⼒于成为产业创新区综合解决⽅案的领导者,整合设计、运营和产业服务,提供全⽣命周期服务。

作为中国产业地产领域设计实践数量最多的机构之⼀,FTA凭借逾1200个办公及产业地产的设计及咨询经验(其中包括3个国家级综合性科学中心的重点项目、多个世界500强总部或区域总部等),已为多个⾼品质业主打造独特的成功体验。

在区域发展和产业规划中,FTA始终秉承专注、⼀体化服务与国际视野,为客户提供从研究、策划到设计的全流程⽀持。我们深耕产业科创园区和产业⽚区领域,成功助⼒上海张江、临港、漕 河泾、市北、G60、闵开发、杨浦科创等重点产业⽚区落地标杆项⽬,此外,在BioBAY、中关村⽣命健康园、张江药⾕等顶级园区的设计中,FTA始终是推动区域创新发展的重要⼒量。

我们服务的客户包括:市北高新、张江高科、天安骏业、上海地产、小米科技、罗氏制药、阿里巴巴、迪士尼、西门子、凤凰卫视、上海港城集团、苏州新加坡工业园区等知名品牌。

相关内容

热门资讯

关联MCN公司谈司马南偷税:他... 界面新闻记者 | 赵孟 蔡星卓 界面新闻编辑 | 刘海川 2025年3月21日,国家税务总局北京...
小米AI眼镜突传消息!多股涨停 值得注意的是,此前多次有爆料称小米将打造AI眼镜,预计在3月至4月发布。 3月24日,AI眼镜板块领...
珍爱网回应闭店:全面核查整改,... 图片来源:视觉中国 3月24日,珍爱网发布《消费者权益保障工作声明》称,近日,个别合作商运营问题引发...
原创 李... 近日,李嘉诚拟向美国贝莱德财团出售43个港口。据媒体报道,双方已经谈妥了所有细节,贝莱德集团高层计划...
3月17日基金净值:前海开源瑞... 证券之星消息,3月17日,前海开源瑞和债券A最新单位净值为1.0433元,累计净值为1.2293元,...
聚焦“AI焦虑”“AI幻觉”,... 人工智能(AI)技术近年来发展迅猛,已迅速蔓延至各个领域,尤其是今年初,国产DeepSeek大模型的...
3月17日基金净值:前海开源公... 证券之星消息,3月17日,前海开源公用事业股票最新单位净值为2.7367元,累计净值为2.7367元...
爆冷!戴维斯30分利夫26+1... 【搜狐体育战报】北京时间3月11日CBA常规赛第39轮,卫冕冠军在上半场领先的情况下惨遭逆转,最终主...
华为大动作,高手看好AI医疗概... 本周,市场风格出现高低切换,市场炒作新热点,如阿里玄铁芯片、AI智能体、军工、小金属等,而一些老热点...
如何在CentOS上设置共享桌... CentOS共享桌面配置指南 在服务器管理与运维场景中,CentOS因其稳定性和开源性被广泛使用,对...