如果有数百个AI智能体,有的负责编码,有的负责生成图像视频,有的负责理解用户需求……它们不断地模拟人类与软件的交互,直到创造出你想要的产品,那它们能不能替代办公软件大厂?
01
AI 智能体成熟得这么快?
从今年年初,初创企业 Monica.im 推出了 AI 工具“Manus”,并自称是首个通用 AI 智能体后,关于“智能体”的相关产品就层出不穷。
所谓的 AI 智能体和 DeepSeek-R1、GPT-4 等我们熟悉的大模型基座并不是同一维度的概念。AI智能体是一款能调用其他第三方基座模型的AI产品,市面现在已经有很多类似的开源项目。相比于 ChatGPT、DeepSeek 等聊天类应用产品,Manus 等 AI 智能体主打的是对复杂指令的理解和执行,即让 AI产品像人类一样解决复杂任务。
现在,一个传统来看具有极深护城河的领域——商业办公软件,受到了 AI智能体带来的挑战。
一向激进的“科技狂人”马斯克把这种挑战放在了明面上。他旗下的初创企业 xAI 最近上马了一个新项目“巨硬(Macrohard)”,从名字开始就和微软(Microsoft)针锋相对。美国专利商标局文件显示,xAI 已于 8 月 1 日为“Macrohard”提交商标注册申请。
根据申请文书,这个新项目可以提供的多项以 AI 为重点的服务,包括“用于人工生成人类语音和文本的可下载计算机软件”和“用于使用人工智能设计、编码、运行和玩视频游戏的可下载计算机软件”。
说 直 白 点,Macrohard 要 直 接 挑战微软倾尽无数心血的 Office 套件和Azure AI 平台,颠覆价值 1.2 万亿美元的软件行业。马斯克还声称,这个项目能“将开发成本砍掉 70%,上市速度提升 40%,杜绝人为失误”。
02
主动代理人进化中
理论上确实如他所想,AI 智能体本来就代表了 AI 从“被动工具”到“主动代理人”的一次跨越。
既然智能体已经不再是一个仅限于对话或完成单一任务的聊天机器人,成了一个拥有类似人类认知流程的“数字人”,那么替代大量程序员、模拟人类与软件的交互等软件研发流程是不是也有可能?
AI 智能体的大脑还是先进的大语言模型(LLM),负责感知与理解,使它能听懂用户的弦外之音。这意味着,用户不需要再输入精确的指令代码,只需用自然语言描述复杂需求,它就能凭借在海量数据中学到的知识和逻辑,准确解析出其中的多重意图和模糊指代。
当然最重要的是它的推理和规划能力如何,是不是能将模糊的指令自主拆解成一系列清晰的、有逻辑顺序的子步骤,并且把这一系列过程完全自动化;还有能不能具有一定纠错能力,遇到障碍时会尝试替代方案。
还有最后的关键一步就是具体的工具使用能力,智能体要通过应用程序接口(API)或模拟操作,直接调用、操控其他软件和服务来执行计划。
如果按照 Macrohard 的设想,它真的构建出了一个强大的 AI 智能体,即能够理解人类的需求,自动生成高质量、可维护的代码,还能自主迭代和优化软件。那它的确可以复制微软从编码到管理的“整个运营”,直接替代掉微软的软件核心业务。
如果这个设想实现,那就意味着人机交互从“人适应机器”迈向了“机器主动适应并服务人”的新时代。
03
传统软件大厂的护城河仍在
而实际上,微软能够建立起这样一个软件帝国,并不是能如此轻易取代的。
传统的软件开发模式依赖于人类程序员编写代码、测试和维护。这个过程耗时、昂贵且容易出错,数万工程师数十年的细致微调才得到现在能够让全球的企业和个人客户“如鱼得水”的效果,也撑起了微软数万亿美元的市值。
而构成微软帝国基石的并非单一产品,而是一个协同网络:从Windows(桌面操作系统)、Office 365(生产力软件套餐)、Azure(企业级云服务),到 LinkedIn(领英,职业社交)、GitHub(开发者生态圈),形成了一个彼此强化、牢不可破的企业级护城河。
更重要的是围绕这些核心产品建立的庞大生态系统、海量用户和企业客户——企业习惯了微软的工具和工作流程,迁移成本极高。即使“巨硬”能提供优质替代品,也需要漫长的时间来赢得信任和市场份额。
毕竟微软倚仗着深厚的客户关系和数十年的经验积累,让企业放弃 Office 365 或 Azure AI,转投“巨硬”的未知方案,能保证软件的安全性、稳定性和可靠性吗?谁能保证 AI 自动生成的代码没有隐藏的漏洞和安全隐患?
AI 在代码生成方面的确取得了显著进展,但要实现完全自主、高质量、无bug 的软件生成,仍有很长的路要走。况且作为 OpenAI“金主”的微软,自己也有内生的 AI 智能体“Copilot”,更胜从零开始的“巨硬”一筹。
而作为用户,我只期待新的 AI 智能体能够低门槛、低成本实现原来必须要微软软件才能实现的结果。