图片 | 来自网络
原创整理 | TOP创新区研究院,FTA Group
转载引用请注明出处。内容仅供交流学习,不做任何商业用途,不代表任何投资建议。
如有侵权请联系后台删除。
每年三月中下旬,GTC的开发者大会,早已变成科技圈的“AI春晚”。这时候,英伟达CEO黄仁勋总会身披标志性的黑皮衣登场,讲讲接下来一年算力世界的剧本。
今年的春晚,英伟达发布了 Blackwell Ultra AI芯片,性能比上一代有显著提升,预计在2025年下半年量产;又甩出了下一代 Rubin GPU平台,定档2026年亮相,连带着2027年的Rubin Ultra和2028年的Feynman,三年路线图一口气铺开,摆明了要锁定未来AI市场;还有机器人领域的重磅—— Isaac GR00T N1开源模型,号称要让机器人也能像人一样干活。
从芯片到软件再到机器人,英伟达是要把AI时代的基础设施牢牢垄断在自己手里。
而这,才是真正的重点。
因为这个“垄断”,跟我们过去理解的那种垄断——靠价格、靠封锁、靠行政,甚至靠平台——都不一样,它靠的是“最优路径诱导”,让整个生态系统主动滑进它定义的轨道。
那么问题来了:
AI时代的现代垄断结构,究竟长成什么样?
它是怎么搭起来的?又有没有可能被打破?
这篇文章有点长,
我们不聊皮衣、不聊技术,就聊聊背后那套系统结构的控制逻辑。
ChatGPT背后
不只是9万美元一颗的芯片
ChatGPT每一次输出、大模型每一次训练背后,都离不开那一块块价值高达9万美元的英伟达芯片。
但,如果我们仅仅将英伟达的成功归因于“性能领先”,未免过于肤浅—— 这就像以为罗马帝国之所以强大,仅仅是因为士兵更高大,而忽略了其隐秘而强悍的制度性结构。
真正让英伟达建立起垄断飞轮的,不是芯片本身,而是它在2006年推出的 CUDA 编程平台。
表面上,它只是为了方便程序员在英伟达GPU上写代码。
但其实,它是一种生态系统的种子代码。
其中最关键的“种子”种在了2016年,那年还是非营利机构的OpenAI接收了英伟达的捐赠,这是“世界上第一台专为人工智能设计的超级计算机”,其核心组件包括8个 基于Volta架构的V100 GPU。
当然,这只是一笔区区12.9万美元的技术赞助。
但是,命运的齿轮开始转动了。
几年后,GPT系列成功,行业标准也就被写进了CUDA的语法里,训练流程、算子接口、资源调度,全都围绕CUDA 构建。
OpenAI的胜利路径,很快成为整个行业的“默认路径”。
全球AI创业者和实验室纷纷接入CUDA,不是因为它最便宜、最优越,而是它最“主流”、最兼容OpenAI的成功方式。
英伟达好风凭借力,在AI崛起的关键时刻,
也悄然将CUDA从“选项”变成了“标准”。
而CUDA和其衍生工具(如PTX、Run:AI、Omniverse)构建的已不只是工具链,而是一套从底层执行逻辑到上层调度策略的完整操作系统。
一旦你使用CUDA,就必须用其编译器、遵循其张量并行模型设计;用Run:AI,就必须在其定义的资源调度规则中优化算力;用PTX,就要接受其底层线程分配和执行方式。也就是说,从底层硬件编程到上层应用开发、调试、优化以及集群管理的各个层面, 都由英伟达定义。
今天的CUDA不再是工具,而是一整套控制结构。
英伟达控制的不是某个产品,而是整个AI工程世界的“运行方式”。
如果在Windows 平台下运行 AI 框架,Nvidia 控制的是“中间三层”,AI软件栈最核心的执行与接口层,图源:docs.nvidia.com
这就好比微软当年用Windows控制PC行业。你可以换键盘、换鼠标,换不了操作系统。
同理,在AI时代,你可以换厂商,但你绕不过CUDA的接口。
经济学上有个经典的说法:
“当一个生态的迁移成本远高于留存成本时,生态就被锁定了。”
这正是CUDA厉害的地方——它让用户产生了路径依赖,而且这种依赖不再只是硬件层面的“兼容”,而是把整个AI工程师的思维方式全都吞进了自己的结构中。
四大巨头
互锁成超级飞轮
而且,这不仅仅是英伟达一家的垄断,而是四家公司共同织就的闭环——
一个看似分工明确,实则层层反嵌的超级生态飞轮。
当然这场飞轮的核心是英伟达。
它本身并不生产芯片,却定义了芯片。设计权掌握在它手中,制造则交由台积电(TSMC)完成。
台积电是这个生态的物理中枢,全球95%的先进AI芯片出自台积电,仅来自英伟达的订单年收入就高达76亿美元。
如果说英伟达是战场上的战略指挥官, 那TSMC就是唯一的军工厂。
而芯片性能要真正释放,还得靠海力士(SK Hynix)提供的高带宽内存(HBM)。海力士长期生存在三星的阴影下,但幸运地凭借2019年突破性的封装设计,解决了AI训练的过热瓶颈问题,一跃成为AI内存唯一的王者。现在它和英伟达是命运共同体:海力士超过80%的HBM3E配给英伟达,而英伟达有接近一半的GPU依赖海力士封装,谁也离不开谁。
再往上溯,就是给军工厂提供装备的ASML——全球唯一能造出EUV光刻机的荷兰公司。这玩意儿一台3.8亿美元,贵过波音飞机,只有ASML能造TSMC一年有13%的资本支出砸在它身上,ASML赚了钱,再反哺TSMC升级产线。
彭博供应链分析根据财报数据画过一张图,图中,微软、亚马逊、谷歌是金主,把巨额资金倒进英伟达换GPU,比如,微软将近一半的资本支出都花在了购买英伟达的 GPU 上,英伟达再把钱给台积电、SK Hynix造芯片,台积电拿到钱又去找ASML买设备,ASML再把利润用来做更先进的研发。
这四家公司看似独立,却是彼此交错、相互嵌套,每一个节点既是依赖者,也是控制者,看似互补,实则互锁,
是一种资本耦合 + 系统锁定的“高频共振结构”。
这也是英伟达跟Intel的根本区别:
Intel是传统制造商,一体自研自产;英伟达是“超级Fabless”玩家,不碰生产,只靠架构设计和接口标准,把全产业链反绑在自己定义的结构上, 它不拥有任何工厂,却控制了工厂的运行逻辑。
财务数据上,英伟达、TSMC、ASML 和SK Hynix四家公司合计市值已超过4万亿美元,相当于一个法国的GDP总量, 英伟达一家便占了标普500指数的约6%。
你以为只是买了ChatGPT的会员,
实际上你是在资助一个结构型垄断系统。
越想逃离
越被绑定
此外,我们也看到了一个令人迷惑的现象:
一方面,越来越多的大厂对英伟达怨声载道:芯片贵、交付慢、不透明,
纷纷表示要逃离英伟达的垄断:比如微软在扶持AMD,让它开发MI300加速器;亚马逊投入自研的Trainium芯片;谷歌则靠TPU体系试图构建自己的飞轮。
但另外一方面,我们看到大厂们加码投入、疯狂抢购GPU,采购量一个比一个狠,部署速度一个比一个快。
为啥会这样?
其实答案很简单:
去依赖=换系统。
而换系统,不是换个供应商这么轻松,是一场整体系重构。
你要换芯片?那训练框架要重写,算子调用要重构,资源调度要改,工程师要重新培训,连数据中心的冷却方案都可能推倒重来。
这不是从A切到B,这是从高铁退回驴车,甚至轮子都要重新造。
那请问,在切换的时候,你就能让自己原来那套体系突然“嘎”了?
当然不能!因为所有的竞争者还在用原来的系统,为了不落后,你一边“逃离”,一边还得“加码”。
这样一来,你要花三倍甚至十倍的成本去维护“两套系统”,以确保过渡期“不断电”,确保没有算力不足、部署延迟、竞争落后等问题,确保自己仍然在牌桌上。
所以在短期内,看上去你在摆脱英伟达,实则这个逃离的过程反而制造了更大的短期算力需求,更强的性能保障焦虑,于是,买得更多、部署得更深、绑定得更紧。
赫希曼在其经典著作《退出、呼吁与忠诚》里早就讲过这类困局: 当退出的代价高于留下的痛苦,大多数人会选择原地踏步。
而像英伟达这种垄断,不靠行政命令维持,而是靠“退出的痛”自我加固。
现在这些科技公司不是“还没意识到被垄断”,而正是“越清醒,反而越深陷”。因为他们知道,真正危险的不是现在买英伟达, 而是“现在不买英伟达、但还没准备好替代系统,先死在了半路上”。
从某个角度来讲,这甚至不是商业层面的策略,
而是技术资本主义垄断的一种宿命:
19世纪末到20世纪,工业时代。我们看到钢铁大王、铁路大亨、石油帝国,这一阶段是 “集中资产控制”——
企业要实现垄断地位,要不有工厂(产能)、要不有石油、钢铁(资源)、要不有铁路(物流),这是物理控制的逻辑。
到了个人电脑与互联网时代,平台开始兴起,比如微软的Windows,谷歌的Search,Apple的iOS生态,谁离用户近,并且能 控制用户的接口与体验,谁就能获得垄断地位, 这是认知接口的控制逻辑。
第三阶段,也就是现在的英伟达, 进入了“结构执行层控制”阶段:
它不控制用户,也不控制制造,但它定义了系统怎么跑、怎么调度、怎么构建。
这正是英伟达所在的新垄断维度——
英伟达只是告诉你一条“最快的捷径”,然后你就自动滑入它设好的轨道,甚至忘了,自己曾经有过选择权。
这才是AI科技帝国的统治方式,不是强迫你跪下,而是让你自己走进笼子,再反锁门。
三条路径
用系统对抗系统
面对英伟达主导的算力帝国,任何一个挑战者,其目的不是搞出一个性能对标、价格更低的替代品, 而是需要花时间,从底层建一套逻辑不同、结构可控、自我进化的新系统,而且系统之间的各个要素得协调得起、撑得住、滚得动。
对于中国而言,受限于芯片供应链的“卡脖子”困境,我们被迫承担起这个“挑战者”的角色。
诺贝尔经济学奖得主、心理学家和计算机科学家赫伯特·西蒙讲过“近似可分系统Near Decomposability”这个概念:
越是复杂系统,越要靠松耦合的模块拼起来;越是追求一体化,越容易崩,只有系统之间“松绑但不脱钩”,才能抵御结构性冲击。
自然界和人类设计的系统都倾向于通过 模块化和松耦合来应对复杂性。
这个概念,也正是中国版AI系统最该吸收的底层智慧。
我们的机会不在“赢在一个环节”,而在“织出一张网”,这张网要从芯片设计,到制造工艺、从内存封装,到软硬结合,再到模型训练,一路延伸到平台部署与行业应用。
这不是一个点挑战中心,而是一群子系统各自自转、彼此勾连。
而在目前,我们能看到了三种雏形,
每一种都是一条不同的挑战路径:
第一条,算法调度型突围,
代表是DeepSeek。
DeepSeek不靠最强芯片,而是通过算法优化来弥补差距:改PTX指令、压缩训练流程、适配旧GPU,用软件弥补硬件短板。
当然,这不是靠预算堆出来的,而是用工程师精神撕出结构缝隙的打法。
咱们可以理解为“软件定义算力”:不是谁家芯片跑得最快,而是谁能把现有算力榨到极致。
这种路径的优势在于跨平台适配能力强,尤其适合资源受限但需求刚性的市场,如中小企业或特定行业应用。
第二条,生态一体化路径,
代表是阿里与百度。
阿里和百度走的不是单点“出奇制胜”的路线,而是在打造一个从算力到应用的完整闭环。它们提供端到端的解决方案:从算力到训练平台,从API到企业部署,全部打包好,用户点一点就能用。你不需要理解模型结构,不需要知道是哪块GPU在算,结果能跑出来、能上线就行。
这种“系统即服务”的模式类似于水电煤气的普及化逻辑——
企业不再关心底层技术,只关注效率提升和成本节约。如果说英伟达通过CUDA统治了“工程师接口”,阿里和百度则瞄准了“用户接口”,英伟达面向开发者,我们则服务于用户。这种路径的潜力在于快速渗透千行百业,构建用户粘性。
第三条,底层协同式链路,
代表是寒武纪、中芯、昇腾等组合
这一路径不追求短期内对标英伟达H100的极致性能, 而是聚焦于打造一套90%性能+100%可控的“本土系统”。例如:寒武纪:专注于AI芯片设计,其NPU在国内特定场景已有应用;中芯国际:作为制造环节,其工艺目前以14nm为主,7nm刚起步,能满足中端需求;昇腾:华为的AI芯片(如昇腾910B)搭配CANN(Compute Architecture for Neural Networks)软件框架,形成较完整的软硬一体生态。
这一组合的优势在于链条短、可控性强,避免关键环节断供,适合政务、工业、城市管理等本土刚需场景,可以将其视为中国版的“备用操作系统”——不求与英伟达正面交锋, 但能在关键时刻自给自足、不掉线。
这三条路径,不是平行赛道,而是三种结构逻辑,可以混合搭建。
真正的目标,不是用它们哪一条“打败英伟达”,
而是能不能用它们共同织出一个结构有弹性、产业有冗余、路径有替代的新飞轮。
因为只有能主导系统的,
才是真正的帝国。
我们总在问谁能造出更强的芯片。但真正决定游戏规则的,从来不是跑得最快的人,而是那个能画路线图、建规则本、定义接口标准的人。
英伟达靠的不是资产,而是结构。
然而,结构可以是钥匙,也可以是锁链。
我们可能推不倒旧飞轮,可能“造不出另一个英伟达”,但我们可以——
把结构打碎重构,用另一套结构,另起一个飞轮。
▼ 点击下方关注TOP创新区研究院(TOP_Lab)
看完想跟我们交流互动?
欢迎扫码加入TOP读者群
↓
二维码只存续到3月30日
如果二维码失效,请后台回复“入群”,
扫描最新二维码,期待群里见到您❤️
创新区研究,就在TOP研究院。
TOP Lab (TOP创新区研究院) 是 FTA 的创新研究引擎,专注于为城市、企业和 园区提供系统化的前瞻洞察与战略建议。基于Talent(⼈才)、Organization(组织)、 Place(区域)三⼤核⼼维度,TOP致⼒于探索全球创新区的发展规律,并结合本⼟实践,为区域发展和企业创新注⼊新的价值维度。
FTA Group:用技术和艺术引领未来。
FTA Group致⼒于成为产业创新区综合解决⽅案的领导者,整合设计、运营和产业服务,提供全⽣命周期服务。
作为中国产业地产领域设计实践数量最多的机构之⼀,FTA凭借逾1200个办公及产业地产的设计及咨询经验(其中包括3个国家级综合性科学中心的重点项目、多个世界500强总部或区域总部等),已为多个⾼品质业主打造独特的成功体验。
在区域发展和产业规划中,FTA始终秉承专注、⼀体化服务与国际视野,为客户提供从研究、策划到设计的全流程⽀持。我们深耕产业科创园区和产业⽚区领域,成功助⼒上海张江、临港、漕 河泾、市北、G60、闵开发、杨浦科创等重点产业⽚区落地标杆项⽬,此外,在BioBAY、中关村⽣命健康园、张江药⾕等顶级园区的设计中,FTA始终是推动区域创新发展的重要⼒量。
我们服务的客户包括:市北高新、张江高科、天安骏业、上海地产、小米科技、罗氏制药、阿里巴巴、迪士尼、西门子、凤凰卫视、上海港城集团、苏州新加坡工业园区等知名品牌。
上一篇:AI医生看病靠谱吗