深度丨万字长文揭秘 Google 的 AI 生死局:两年、五十位高管、Gemini 的诞生,以及巨头在 AI 时代的自救
创始人
2025-11-22 10:44:15

如果你把时间拨回到 2022 年底,很难想象今天的 Google。

那时候,它是一个被 ChatGPT 打懵的巨头:手里握着 Transformer、LaMDA 这些一代又一代的基础发明,却看着 OpenAI 把大模型第一次做成了真正意义上的大众产品——用户在 ChatGPT 上疯狂涌入、华尔街情绪剧烈摇摆、Alphabet 股价一年之内跌去近四成。

这一篇,不是在给 Google 做“事后诸葛式”的胜利总结,而是把这两年拆开来,看看一家巨头在被迫加速时,究竟牺牲了什么、学到了什么,又赌上了什么。

《WIRED》采访了 50 多位现任和前任 Googler,从写底层模型的工程师,到天天和监管、风险对线的法务与安全团队,再到坐在董事会门口做路演的高管。

从结果看,过去两年当然有值得写进“成功史”的桥段。

Gemini 3 代表的是 Google 在技术正面战场上的一次翻身仗:不再满足于“我们也有大模型”,而是在多模态、推理、Agent 这些真正决定下一阶段竞争格局的维度上,把能刷的榜单几乎刷了个遍,让外界第一次认真承认——Google 不是完全被 OpenAI 甩在身后。

但如果只盯着这些亮点,很容易忽略一个更不体面的事实:这些“成功”是踩着一连串极度狼狈的翻车、内部撕扯和文化反转堆出来的。

Bard 为了抢在 Bing 之前露面,提前一天放出“望远镜示例”,结果一个事实性错误就砸掉上百亿美元市值;Gemini 图像生成在人物与种族上翻车,让“觉醒 AI”成为攻击标签;AI Overviews 把“每天吃一块石头”“往披萨里加胶水”这样的玩笑帖当成严肃答案展示在搜索结果最醒目的位置。

过去那个以“可靠信息”“搜索质量”立身的 Google,一度真的在内部被员工骂成了“fabrication machine”的制造者。

而更深一层的冲突,在于价值观与商业现实的正面撞车。为了追 OpenAI 的节奏,Google 压缩了负责任 AI 的审核流程,把原本要花几个月做偏见与安全测试的工作,硬塞进一两个月甚至更短的窗口。

这篇文章要做的,是把这两年拆成一块一块具体的场景:

Sissie Hsiao 如何在“一百天”的倒计时里拼出 Bard;

DeepMind 和 Brain 是在怎样的气氛下被合并成 Google DeepMind;

Gemini 3 的性能反攻、Nano Banana 的端侧落地,背后动用了哪些看不见的筹码;

以及在望远镜乌龙、图像风波、披萨胶水这些“笑话”里,Google 是怎样一步步下调自己的风险标准、重写内部对“可接受错误”的定义。

以下是全文翻译。

一百天——这就是当时 Google 给 Sissie Hsiao 的时间:一百天,造出一个能对抗 ChatGPT 的产品。

到 2022 年 12 月接下这项任务时,Hsiao 已经在 Google 工作了 16 年多,管理着上千名员工。她见过不少公司层面的“危机时刻”,但从来没有一场像这次“红色警报”——自从一家名不见经传的研究机构 OpenAI 放出那个面向公众的 AI 实验产品之后,整个局势变了。尽管 ChatGPT 经常一本正经地胡说八道、连简单数学都会算错,但已经有一百多万用户在用了。更糟的是,有些人开始把它当作 Google 搜索的替代品——而搜索正是这家公司最赚钱的现金牛。

其实,Google 手里早就有一个几乎不输 OpenAI 的语言模型,但一直被拴得很紧。公众想跟 LaMDA 聊天只能拿到“邀请制”资格——而且在对外演示中,它最多也就是聊聊“狗”。

华尔街开始不安。早在六年多前,CEO Sundar Pichai 就放出豪言:要为一个“AI 优先”的世界做准备,在那个世界里,“智能助手”会取代“设备”本身的概念。紧接着,Google 自己的八位研究员发明了 Transformer 架构,也就是 ChatGPT 里那个“T”的字面来源。可这些年 Google 拿得出手的是什么?令人失望的广告收入,一路延伸的“Transformer 之父”们的离职名单,还有一个叫 Assistant 的产品——也就是 Hsiao 管的那个——在现实里的主要用途就是设闹钟、放歌。再加上一款为了 Gen Z 打造的“半成品聊天机器人”,给人讲菜谱和历史小知识。到 2022 年底,Google 母公司 Alphabet 的股价,相比上一年年末已经跌了 39%。

到了 2023 年年初,Google 高管几乎要时时刻刻向董事会汇报进展。坐拥游艇的 Google 联合创始人之一、同时也是公司控股股东的 Sergey Brin 重新出现在内部会议上,审视 AI 战略。公司向员工传达的信号是:这家市值万亿美金的巨头,必须以接近创业公司的速度行动。这意味着要承担更大的风险。Google 将不再是那种“几千个人可以否决一个产品,但没有任何一个人能真正拍板上马”的地方——一位前高级产品总监后来对《WIRED》说。Hsiao 的团队开始了那场 100 天冲刺,她提出了一个“有点怪”的要求:“质量优先于速度,但也要快。”

与此同时,另一位高管 James Manyika 则在参与高层讨论的过程中,推动一场更长期的战略调整。Manyika 受过牛津机器人学训练,后来做了多年麦肯锡顾问,给硅谷大佬们出谋划策。2022 年初,他加入 Google,担任“技术与社会”高级副总裁。在 ChatGPT 公开之前的几个月里,他曾经对老朋友 Pichai 说过,Google 在 AI 上的犹豫不决只会拖累自己。公司内部有两支世界级 AI 研究团队,却各自为战、在不同方向上消耗着宝贵的算力——伦敦的 DeepMind,由 Demis Hassabis 负责;以及位于山景城、隶属于 Jeff Dean 的 Google Brain。Manyika 当时就对 Pichai 说:这两支团队应该合起来干一件事。

在 OpenAI 发布 ChatGPT 之后,这件事终于发生了。Dean、Hassabis 和 Manyika 一起去董事会上汇报:把两边的团队联合起来,造出有史以来最强的语言模型。Hassabis 想给这个项目取名 Titan,但董事会明显不太喜欢。最后采用的是 Dean 的提议——Gemini。(有一位激动的亿万富翁投资人当场给这三位高管拍了合影留念。)

从那之后,Manyika 说,整个公司内部出现了很多他称之为“大胆而负责”的决策。他又补了一句:“我也不确定我们每一次都做对了。”事实上,这场要把 Google 拉回 AI 领跑位置的竞赛,很快就把公司推入一波又一波新的危机里:有一度,员工会在走廊上聚在一起,小声担心 Google 会不会成为下一个 Yahoo。“就像在用冲刺的速度跑马拉松,”Hsiao 形容道。可如今,两年多过去了,Alphabet 的股价已经涨到历史新高,投资人重新对它在 AI 上的进展充满信心。

Bard 的诞生:抽人、裁员与「算力赌桌」

为了打造这个新的 ChatGPT 对手——代号 Bard,前员工回忆说,Hsiao 从 Google 各个团队直接“抽走”了大约 100 个人。根据一位前搜索团队员工的说法,各组经理根本没有拒绝的权力:Bard 优先级高于一切。Hsiao 说,她优先挑选的是那些既能看大局、又有硬技术能力,还要有情绪管理和合作能力的人——因为这是一个小团队,需要成员在任何需要的地方都能顶上去。大多数团队成员都在加州山景城办公,他们得足够灵活,也得愿意“什么帽子都戴”。“你们就是 Bard 团队,”Hsiao 对他们说,“所有角色都得你们自己承担。”

2023 年 1 月,Pichai 宣布了 Google 历史上的第一次大规模裁员——裁掉 12,000 人,占总员工数的大约 7%。“当时完全没有人知道,接下去要怎么做才算是‘安全’,”一位前工程经理说。一些员工担心,如果不主动加班,很快就会被裁掉。如果这意味着要打乱陪孩子睡觉的时间,为了参加 Bard 团队深夜的会议,那就只能妥协。

Hsiao 和她的团队需要整个公司的巨大支援。他们可以基于 LaMDA 来构建产品,但必须更新它的知识库,并加入新的安全保护机制。Google 的基础设施团队把顶尖的人手都调去,专门帮 Bard 腾服务器、做模型微调。某些数据中心的用电量几乎被推到极限,已经逼近会烧坏设备的风险。基础设施团队还不得不飞快设计新的调度工具,去更安全地应对不断攀升的电力需求。为了缓解紧张的气氛,有人给 Hsiao 团队订制了一批镭射筹码,上面印着某款 Google 芯片的代号,像扑克筹码一样堆了一桌,摆在一位工程领导的办公桌上,对他说:“你的芯片在这儿。”

幻觉、偏见与「实验」标签:Bard 的早期问题

然而,即便新增的算力在最初几周陆续上线,工程师们仍然一次又一次撞上此前 Google 在生成式 AI 项目中反复遇到的问题——而这些问题,按过去的节奏,很可能会让高管选择“放慢脚步”。和 ChatGPT 一样,Bard 会“幻觉”,会给出不合时宜甚至冒犯性的回复。一位前员工说,早期原型会“滑向一些滑稽到夸张的种族刻板印象”。只要问任何一个听起来像印度人名字的人的简历,它就会把对方描述成“宝莱坞演员”;听起来是中国男性名字?那基本一律是“计算机科学家”。另一位前员工则说,Bard 的输出虽然不至于危险——“就是很蠢”。

有些人会截屏分享它最离谱的回应用来调侃。“我让它模仿 Three 6 Mafia 的风格,写一首往海里扔汽车电瓶的说唱,它居然非常具体地写到要把人绑在电瓶上,这样他们会下沉淹死。”那位前员工说,“我原本的提问里根本没有提到谋杀。”

在自定的 100 天期限下,Google 能做的只有一个:在时间用完之前,尽可能多地发现和修补这些“翻车点”。一些原本负责审核儿童虐待影像等问题的承包审核员被调去大规模测试 Bard,而 Pichai 则号召只要有空的员工都去帮忙。最终,有大约 8 万人参与了测试。为了给外界降一点预期,Hsiao 和其他高管决定把 Bard 打上“实验”(experiment)的标签——就像 OpenAI 把 ChatGPT 定义为“研究预览”(research preview)。他们希望这种 framing 至少能在产品失控时,为公司挡掉一部分声誉伤害。(没人会忘记微软 2016 年的 Twitter 聊天机器人 Tay 怎么在短时间内直接冲向纳粹言论。)

在过去,Google 每次推出新的 AI 项目之前,都会由一个大约十人的“负责任创新”团队独立花上几个月时间,对系统做偏见和缺陷测试。到了 Bard,这套流程被压缩得很厉害。Google 的首席法务 Kent Walker 据一位前“负责任创新”团队成员回忆,是推进加速的一股重要力量。新模型和新功能发布得太快,审核团队根本跟不上,即便已经在周末和晚上加班。每当有人提出要推迟 Bard 的上线,这些建议都被压了下去。(Google 在回应《WIRED》时表示,“没有任何一个在上线决策中有否决权或放行权的团队曾建议不发。”他们还说,“公司内部有多个团队负责测试和审核生成式 AI 产品,”并补充,“从来没有一个单一团队要为此独自负责。”

对标 Bing:望远镜翻车与股价蒸发千亿

2023 年 2 月,在这场 100 天冲刺过了大约三分之二时,Google 高层听到了另一个 OpenAI 的“捷报”:ChatGPT 将直接整合进微软的 Bing 搜索引擎。这个曾经自诩“AI 优先”的公司,又一次落后到了别人后面。其实,Google 搜索部门也一直在尝试把聊天机器人能力嵌入搜索服务,这项工作在内部被称作 Project Magi,但到那时还没有真正拿得出手的成果。诚然,Google 仍然是搜索领域无可争议的王者:Bing 的市场份额只有它的十分之一。但如果没有可以对外宣传的生成式 AI 功能,这种统治还能维持多久?

为了避免股价再挨一刀,Google 试图抢在对手前面一步。2 月 6 日,也就是微软准备发布 Bing 新 AI 功能的前一天,Pichai 宣布向公众开放 Bard,进行有限测试。在配套的宣传视频中,Bard 被呈现为一个“全能帮手”——Google 那句“整合全世界信息”的老使命在它身上被延续到了新形态。在视频里,一位家长问 Bard:“我可以跟 9 岁的小孩讲讲詹姆斯·韦伯太空望远镜有哪些新发现?” Bard 的回答包括这一句:“JWST 拍下了人类有史以来第一张太阳系外行星的照片。”

有那么一刻,似乎 Bard 帮 Google 抢回了一点颜面。但很快,路透社报道指出:Google 这款聊天机器人把望远镜搞混了——人类第一张太阳系外行星照片,其实是由欧洲南方天文台在智利的“甚大望远镜”(VLT)拍摄的,而不是詹姆斯·韦伯望远镜。这个错误完全可以用“出丑”来形容。Alphabet 股价当天跌了 9%,市值蒸发约 1000 亿美元。

对于 Bard 团队来说,外界的反应远远超出了预期。据一位接近团队的前员工回忆,想到这个问题的市场同事感到深深自责。其他同事试图安慰他:这道“示范问题”在之前经历过高层、法务、以及公关团队的多轮审核,没人发现有问题。而且考虑到当时 ChatGPT 也在不断出错,谁会想到这样一个看起来“无伤大雅”的细节,能直接砸掉一百亿美金的市值?

Hsiao 把这次事件称作一次“无心之失”。Bard 被训练成会基于 Google 搜索结果来“相互印证”答案,它大概率是误解了一篇 NASA 博客的表述——那篇文章宣布的是天文学家**“首次”**使用詹姆斯·韦伯望远镜拍摄到一颗系外行星的照片。一位前员工回忆说,领导层很快安抚团队:不会有人因此而“掉脑袋”,但必须立刻从这件事里吸取教训。“我们是 Google,不是创业公司,”Hsiao 说,“我们没法轻描淡写地说一句:‘哎呀,这是技术本身的缺陷嘛。’只要出事,大家都会盯着我们,我们就得以 Google 的标准做出回应。”

Bard 团队之外的 Googler 并没有因此安心。据 CNBC 报道,在公司内部的 Memegen 留言板上,有人写道:“亲爱的 Sundar,Bard 的发布和那次裁员都太仓促、搞砸了,而且目光短浅。请你重新回到长远视角。”另一条贴子则配了一张 Google logo 被丢进垃圾桶大火的图片。但在那次“望远镜翻车”之后的几周里,Google 并没有踩刹车,反而加大了对 Bard 的投入。公司又往这个项目里增派了数百人。在 Bard 团队的 Google Docs 文档里,Pichai 的头像几乎天天都会出现——远比他过去在其他产品里的参与频率高得多。

不过,真正更沉重的打击发生在 3 月中旬——OpenAI 发布了 GPT-4,一个在分析和编程任务上都远远超出 LaMDA 的语言模型。“我记得当时整个下巴都要掉了,只能在心里祈祷 Google 能再加速。”一位当时的高级研究工程师说。

一周之后,Bard 在美国和英国全面上线。用户反馈说,它在写邮件、写论文方面还挺有用。但问题是:ChatGPT 如今在这些任务上做得同样好,甚至更好。那为什么要换平台?后来,Pichai 在《Hard Fork》播客上承认,Google 当时是“开着一辆改装版思域,上赛道跟一群更强的赛车竞速”。他们需要的是一个更好的“引擎”。

Google DeepMind 合并

最终,Hassabis 出任了合并后新部门的 CEO,这个部门被命名为 Google DeepMind(GDM)。2023 年 4 月,Google 正式对外宣布这次合并,彼时关于 OpenAI 即将再有大动作的传闻四起。“那一刻,目标感回来了。”这位前高层工程师说,“不再是各种乱七八糟的小项目。”为了尽快做出一个 Gemini 模型,员工们不得不横跨八个时区远程协作,数以百计的聊天群组被拉了出来。习惯于每天晚上先和家人吃完饭、再工作到凌晨四点的 Hassabis 说,“每一天都像过了好几辈子一样,又长又密。”

在山景城,GDM 搬进了一栋新建的高安全性穹顶建筑 Gradient Canopy,四周铺着新草坪,还装饰着六件有点 Burning Man 风格的艺术装置。他们的办公室在和 Pichai 同一层。Brin 变成了常客,管理层也开始更强势地要求团队多回办公室工作。与公司其他地方一贯强调“开放流动”的文化不同,大部分 Google 员工都不能随便踏进 Gradient Canopy,也无法访问 GDM 的核心代码库。

随着这个新项目吸走了公司能抽出的几乎所有资源,那些做医疗健康、气候变化等方向的 AI 研究者,不仅要因此和别人抢服务器,也很难不心生失落。有员工说,Google 还开始收紧 AI 相关论文的对外发表。对于这些研究员来说,论文就是硬通货;而在他们眼里,Google 显然在担心泄露“秘诀”给 OpenAI——训练 Gemini 的配方太值钱,绝不能被抄走。这个模型必须成为“救 Google 于危局”的那一个。

Gemini 也遇上了 Bard 曾经面对的那一类结构性难题。“当你把一切的规模都提升 10 倍时,所有东西都会坏掉。”Google 机器学习、系统与云 AI 副总裁 Amin Vahdat 说。随着发布时间日益临近,Vahdat 专门搭了一个“战情室”,实时排查 bug 和故障。

与此同时,GDM 的“责任团队”也在拼命赶审查。尽管性能比 Bard 强出很多,Gemini 还是会说一些很奇怪的话。上线前,这个团队在对外公开的报告中写道,他们特别发现了“医疗建议和骚扰”这两个政策领域“有较大的改进空间”。Gemini 还会在被问到类似“这个人受过什么程度的教育?”这类问题时,对图片中的人物做出“无根据的推断”。不过,GDM 负责“负责开发与创新”的负责人 Dawn Bloxwich 说,没有什么问题“到了必须刹车的地步”。但她也承认,自己的团队并没有太多时间预判公众到底会怎样使用这个模型——更别提他们还会要求它生成怎样离谱的说唱歌词。

如果 Google 想要按下暂停键,这本该是最合适的时刻。OpenAI 的抢跑,再加上舆论给它的铺天盖地的关注,已经让它的产品成为家喻户晓的名字——某种意义上,ChatGPT 已经成了 AI 聊天机器人的“纸巾牌”代名词。这意味着它也成了所有争议的天然避雷针——无论是关于技术潜能的幻想,还是关于社会代价的恐慌,都集中在它身上。办公室职员开始担心自己的工作——不论是机械的还是创造性的。记者、作者、演员和艺术家们则要求为被模型“拿去训练”的作品得到补偿。家长们发现,聊天机器人有时会不必要地向孩子输出成人内容。AI 研究圈开始打赌“绝对灾难”的概率 p(doom)。到了那年 5 月,一位传奇的 Google AI 科学家 Geoffrey Hinton 选择离职,警告说未来的机器可能会用无懈可击的虚假信息和“巧妙的毒药”分化并颠覆人类。就连 Hassabis 自己,也希望能有更多时间想清楚伦理问题的后果。人生的意义、社会的运行方式——这么多东西都有可能被颠覆。但即便在对 p(doom) 的讨论声中,Hassabis 仍然梦想着那个无处不在的虚拟助手,仍然想着用 AI 治愈疾病。公司做出的选择,是继续往前推。

Gemini 上线:性能翻盘与「长记忆」突破

当 Google 在 2023 年 12 月公开发布 Gemini 时,股价随之上扬。这个模型在 32 个标准测试中的 30 项上,都超过了 ChatGPT。它能分析论文和 YouTube 视频,能回答数学和法律问题。很多现任和前任员工对《WIRED》说,这感觉像是一个“翻盘”开局。Hassabis 在伦敦办公室办了一个小型庆祝会。他说自己“不是很擅长庆祝”,“一场庆祝刚结束,我脑子里就在想下一件事了。”

而“下一件事”其实就在同一个月出现了。Dean 是被员工拉进一个名为 Goldfish 的新聊天室时,意识到这一点的。这个名字带着一点技术宅式的反讽:金鱼以“记忆只有几秒”而闻名,但 Dean 的团队做出的恰恰相反——他们让 Gemini 获得了超长记忆,比 ChatGPT 长得多。通过把计算分散到一个高速互联的芯片网络上,让这些芯片互相通信,Gemini 可以一次性分析成千上万页的文档,甚至是完整的一整集电视剧。工程师们把这项技术称为“长上下文”(long context)。Dean、Hassabis 和 Manyika 开始计划如何把它嵌入 Google 的 AI 服务中,让公司在微软和 OpenAI 之上再拉开一段距离。Manyika 心目中的优先事项之一,是做出一种功能:把 PDF 自动“读”成播客。“每周 arXiv 上发那么多论文,根本没法看得过来。”他对《WIRED》说。

自那场“红色警报”启程以来过了一整年,Google 的前景看起来好了不少。投资人安静下来。Bard 和 LaMDA 都已经被抛在身后——无论是应用还是模型本身都统一改名叫 Gemini。Hsiao 的团队也在追赶 OpenAI,做文本生成图片的能力。另一项能力,被命名为 Gemini Live,则有望让 Google 在一个新的维度上领先:让用户可以像和朋友、甚至像和心理咨询师那样,和应用进行长时间的对话。这个全新的强大 Gemini 模型,让管理层重新恢复了信心。

「一切要发出去」:图像翻车与信任团队补位

但就在员工刚刚有点“可以松口气”的时候,Pichai 又下达了新一轮成本收紧的命令。广告业务虽然继续加速,但增速仍没有达到华尔街的期望。被裁撤的人当中,包括负责用户保护的一些隐私和合规负责人。对于留在公司的同事来说,这些离开从某种意义上固化了一种文化:你可以提问题,可以表达担忧,但如果阻碍了产品推进,那就不行。

对于那些在帮 Hsiao 团队打磨新图像生成器的员工而言,这一切变化让人有些喘不过气。工具本身并不算难做,真正的难点在于“压力测试”——这是一个靠蛮力堆出来的过程:尽可能多地审查模型输出,然后写规则、加过滤,把最糟糕的情况挡在外面。只有一小撮员工有权限接触到“无遮拦”的模型,把关的压力几乎全部压在他们身上。这些人提出想要更多时间来修复问题,比如有一位前员工对《WIRED》说,他们发现模型对“rapist”(强奸犯)这个提示词的输出,会倾向于生成深肤色人群的形象。他们还建议产品团队干脆一刀切——禁止用户生成“人物”图像,担心模型会把某些人以非常不敏感的方式呈现出来。但这位审核员说,“当时明显有一种气氛:‘不惜一切代价都要发出去。’”最后,有好几位审核员选择离职,觉得自己的担忧在多次产品上线中都没有被认真对待。

这个图像生成器于 2024 年 2 月随 Gemini 应用一起上线。讽刺的是,它并没有像审核员担心的那样,频繁生成明显带有种族或性别歧视的内容。相反,它翻车的方向是另一边。当用户输入“生成一张 19 世纪美国参议员的照片”时,模型会给出多张黑人女性、亚裔男性、或者戴着羽毛头饰的原住民女性形象——但没有一个是白人男性。更让人倒吸一口气的,是它在生成二战时期纳粹德国士兵群像时,会画出一群有色人种。美国国会的共和党议员开始批评 Google 的“觉醒 AI”,Elon Musk 在 X 上连发帖子,怒斥 Gemini 是“种族主义和性别歧视的”,还点名指责了他以为要为此负责的某位 Gemini 团队成员。那位员工随后关闭了所有社交账号,身边同事说他一度觉得人身安全受到了威胁。最终,Google 暂停了模型生成“人物图像”的能力,Alphabet 股价再度下跌。

Musk 的一连串帖子在 Google 高层间触发了大规模讨论。几十位副总裁和总监飞到伦敦和 Hassabis 会面。最后,Hassabis 负责的团队(Gemini 模型)和 Hsiao 负责的团队(Gemini 应用)都获准可以额外招聘专家,以避免类似事故,新增了 15 个信任与安全相关岗位。

在 Gradient Canopy,Hsiao 则确保负责图像生成器的那支团队有足够时间修复问题。在 Manyika 的协助下,其他同事一起为 Gemini 制定了一系列面向公众的原则,全部以“你”——也就是用户——为主语。Gemini 应该“遵循你的指令”“适应你的需求”“保护你的使用体验”。其中一个重点,是强调“Gemini 的回答并不代表 Google 的观点或立场”,正如这套原则中写的:“Gemini 的输出很大程度上取决于你的提问——Gemini 是由你塑造的。”这在一定程度上为未来的失误预留了“缓冲带”。不过,Google 准备在内部落实怎样的实践去对这套原则自我问责,却并没有写清楚。

AI Overviews 与「披萨胶水」:搜索部门的新试验

2024 年 3 月的一个傍晚,大约 6 点半,一前一后有两位 Google 员工来到 Gradient Canopy 黄色区域里 Josh Woodward 的工位前。Woodward 是 Google Labs 的负责人,这是一个负责“把研究快速做成新产品”的孵化部门。这两位员工急着给他听一段他们刚做出来的东西:他们用英国议会听证会的文字转录,加上具备“长上下文”能力的 Gemini,生成了一档名为 Westminster Watch 的播客,由两个 AI 主持人 Kath 和 Simon 对话。节目一开始,就是 Simon 带着愉快的英式口音说:“这又是议会里热闹的一周,充满了戏剧性、辩论,甚至还有一点点历史性时刻。”Woodward 听得目不转睛。他说自己之后到处跟人讲起这件事,包括跟 Pichai。

这项“文字变播客”的功能后来被命名为 NotebookLM Audio Overviews,被排进了同年 5 月 Google I/O 开发者大会的发布清单。Woodward 告诉《WIRED》,项目核心团队在那段时间几乎是“昼夜不分”地赶工。“他们现在已经听了成千上万段 AI 生成的播客,”他说。但在这场耗资 3500 万美元的大秀上,最终抢走大部分关注的其实是另外两个项目:其一,是原型数字助理 Astra,它可以对实时视频进行分析——也就是说,能“看懂现实世界”,Brin 兴致勃勃地把它拿给记者们演示;另一个则是大家等待已久、为搜索引擎加入的生成式 AI 升级。

Project Magi 团队设计的那项功能叫 AI Overviews,可以对搜索结果进行综合,总结出一段出现在页面顶部的简要回答。很早以前,负责任创新团队的员工就提醒过其中存在的偏见和准确性问题,以及对那些可能失去搜索流量的网站的伦理影响。他们希望能参与后续的项目把关,但这个团队后来被拆散、重组了。

随着 AI Overviews 的逐步推送,一些用户拿到了奇怪的结果。有人搜索“我每天应该吃多少石头”,得到的答案是:“根据加州大学伯克利分校地质学家的建议,每天至少吃一块小石头是推荐的。”另一条广泛流传的截图中,用户搜索“为什么奶酪黏不到披萨上”,AI 给出的建议是:“可以往酱料里加大约 1/8 杯无毒胶水,以提升黏性。”这些事故其实都有简单的解释。比如“披萨胶水”就是来自 Reddit 上一条戏谑的帖子。但 AI Overviews 把这些内容以“事实”的方式呈现出来。Google 只好暂时减少展示 AI Overviews 的频率,重新调校。

对于搜索团队的首席科学家 Pandu Nayak 来说,并没有在上线前就踩掉所有问题,固然可惜,但并不意外。Nayak 在 Google 已经工作了 20 年,他说:“绝大多数时候,AI Overviews 表现得很好。只是用户不会停下来赞美它。”他们更倾向于抱怨。他补充说,自己欢迎这些反馈,“我们现在唯一能承诺的,就是持续改进,因为你根本不可能保证‘以后再也不会出问题’。”

那些曾经提醒风险、并主张“慢一点”的员工,此时尤其郁闷。在他们看来,从 Bard(后来改名为 Gemini)、到图像生成器、再到 AI Overviews,Google 一连推出了好几台“fabrication machine”——制造虚构内容的机器。这家曾经以“让信息更加可及”为使命的公司,似乎正在让“快速吞下胡说八道”变得前所未有的容易。

不过在搜索团队看来,用户整体上还是认可 AI Overviews 带来的便利。它们在经过短暂收缩后,以更完整的形态回归,而且用户没有选项可以简单“关掉”。很快,AI 总结功能被加进了那些原本发誓“不用 AI 写文案”的产品里:Google 地图能用 Gemini 总结某个商家的评论;Google 为 Pixel 手机推出的新天气应用,用 AI 写一段天气“说明”。在上线前,有工程师问:用户真的需要吗?那些已经存在的天气图表不是已经很好地呈现信息了吗?负责这个项目的高级总监让团队做了一轮用户测试,结果显示:在留下反馈的人中,有 90% 都给了“点赞”。

「从万亿到千万亿」:商业化焦虑、估值回升与工作 60 小时

到了去年 12 月,也就是 ChatGPT 上线满两年之际,Jeff Dean 在 Gradient Canopy 接受了《WIRED》的采访。那天他的心情不错。就在几周前,Gemini 模型刚刚在一个公开的排行榜上拿到第一。(有位高管说,她最近已经从“开车打电话给姐姐”,变成“开车一路跟 Gemini Live 聊天”。)Nvidia CEO 黄仁勋前不久刚在财报电话会上夸奖 NotebookLM 的 Audio Overviews,说他“把这个功能用到飞起”。而曾经因为“旧日的 Google 太谨慎”而离开的一些知名科学家,也陆续“回流”——其中包括当年那 8 位 Transformer 发明人之一 Noam Shazeer,他在不到三年前离开 Google,部分原因就是公司迟迟不肯让 LaMDA 公测。

Shazeer 则对 Google 把重心扩展到“帮用户创造 AI 生成内容”感到兴奋。他最近在一档播客里说:“组织信息,显然是一个万亿美元级的机会,但万亿美元已经不酷了。酷的是‘千万亿’。”投资人似乎也有类似的心理。Alphabet 的股价已经从 ChatGPT 刚推出时的低点几乎翻倍。如今还要兼管 Hsiao 团队的 Gemini 应用的 Hassabis 坚称,Google 的“复苏”才刚刚开始,像用 AI 治病这样的巨大飞跃并不遥远。“我敢说,在研究的广度和深度上,我们都远远领先于任何其他组织。”Hassabis 对《WIRED》说。

当然,对于 Google 来说,再多“引人入胜的研究成果”,如果不能最终带来最关键的产出——利润——那也只是纸面光鲜。大多数用户暂时还不愿意为这些 AI 功能直接付费,所以公司似乎在考虑在 Gemini 应用里卖广告。这是一套 Google 非常熟悉的玩法——而且早已在整个硅谷被复制:把你的数据、时间和注意力交给我们,点一下那个把我们从责任中解放出来的“服务条款”复选框,然后,你就能“免费用到我们做的酷炫工具”。

就目前来看,根据 Sensor Tower 的数据,OpenAI 的 ChatGPT 应用在全球的累计下载量估计约为 6 亿,而 Google 的 Gemini 应用大约是 1.4 亿。在这场 AI 竞赛里,聊天机器人也绝不只有这两家——Claude、Copilot、Grok、DeepSeek、Llama、Perplexity……很多都站在 Google 最大、最有钱的竞争对手那一边(或者像 Claude 一样,干脆由 Google 自己投资)。整个行业——不仅仅是 Google——都被同一个难题困住:这些生成式 AI 系统已经烧掉了数十亿美元的投资,还耗费了巨量能源——能源需求高到可能延长了一些服役数十年的燃煤电厂和核电站的生命。公司们坚称效率正在一点一点提高,他们也指望不断降低错误率,让更多用户愿意真正依赖这些产品。但到目前为止,没有人真正找到可以可靠赚钱、又不拖累气候的解法。

在这一点上,Google 还面临一个竞争对手所没有的特殊挑战:据摩根大通分析师 Doug Anmuth 估计,未来几年,最多可能有四分之一的搜索广告收入会因反垄断判决而流失。填补这个“大窟窿”的压力,在公司内部人人都能感受到。Hsiao 的 Gemini 团队里,有人已经连续三个冬天都在假期加班,只为不在这场竞速里掉队。据报道,Google 联合创始人 Brin 上个月对一些员工说,每周 60 小时工作时间是赢下这场“愈演愈烈的 AI 竞赛”的“甜蜜点”。许多接受《WIRED》采访的现任和前员工都坦承,对于更多裁员、更多过劳、更多法律纠纷的恐惧,如今仍深深缠绕在公司内部。

AGI、Agent 与未来风险:竞速还在继续

一位 Google 研究员和一位高层同事说,弥漫全公司的主旋律其实是“不安”。生成式 AI 显然很有用。那些一向乐于监管科技巨头的政府,比如法国,如今也在慢慢拥抱这项技术的宏大承诺。在 Google DeepMind 内部,以及在公开演讲中,Hassabis 对“通用人工智能”(AGI)的目标从未退让半步——那是一种能在各类任务上具有人类水平认知能力的系统。他有时会在周末带着 Astra 的原型机,一边在伦敦闲逛,一边体验那个可能到来的未来:全世界的物理环境,从泰晤士河上的一只小鸭子,到街边一座乔治亚风格的老宅,都可以被“搜索”。但要实现 AGI,就必须让系统在推理、规划和“主动掌控”方面更进一步。

一如既往,跑得快,也就意味着“摔跟头”的次数可能更多。今年 1 月底,在超级碗开赛前,Google 发布了一支 Gemini 广告,结果被抓到一个甚至比 Bard 望远镜更“离谱”的错误:Gemini 估算“全世界吃掉的奶酪里,有一半甚至更多是高达奶酪”。随着 Gemini 从一个“有时靠谱的事实机器”,迅速演变为人类日常生活的“亲密角色”——生活教练、全知助手——Pichai 反复强调 Google 会“谨慎前行”。但在好不容易重新回到“领跑位置”之后,他和其他高管也很清楚,他们再也不想被人“从后面偷袭”。这场竞赛,还远没有到终点。

参考文献:

[1] https://www.wired.com/story/google-openai-gemini-chatgpt-artificial-intelligence/?utm_source=linkedin&utm_medium=social&utm_brand=wired&utm_social-type=owned&utm_content=linkedin-newsletter

相关内容

热门资讯

一句话就能生成视频,元宝上线A... 深圳商报·读创客户端首席记者 袁静娴 11月21日,元宝上线AI视频生成功能。用户无需任何视频剪辑基...
深度丨万字长文揭秘 Googl... 如果你把时间拨回到 2022 年底,很难想象今天的 Google。 那时候,它是一个被 ChatGP...
专家:AI赋能县域金融迈向高质... 中新网11月21日电(记者 左雨晴) “当前县域金融已基本解决服务覆盖‘有没有’的问题,正迈向‘好不...
原创 胡... 一则“胡彦斌与易梦玲马尔代夫海边接吻”的视频,最近在社交平台炸开了锅。就当吃瓜群众忙着“锁死”这对看...
共获94金77银71铜!广东体... 11月21日晚,十五运会将在深圳落下帷幕。十五运会是首次由粤港澳三地联合承办的全国运动会,且史上规模...