原创 一家中国独角兽如何求解AI终局之战
创始人
2025-10-30 22:43:56

作者 | 云帆

“因访问量激增,远超我们的预期,下午线上服务的成功率降至90%,我们对由此带来的不便深表歉意。”29日深夜,MiniMax官方公告中向公众致歉,据说,这篇道歉信是创始人闫俊杰亲笔。

事情的起因是,三天前MiniMax发布的M2文本模型登顶全球前五、开源第一,在海外AI开发者和技术圈中引起了广泛的关注。闫俊杰此前慷慨承诺“M2对公众限时免费,直到服务器爆了”,那是他第一次署名在公司公众号发文。许多海外开发者和科技博主都对M2进行了测评,想亲自试试这个被称为“目前Coding能力最好,部署效率最高”的国产大模型。口口相传下,海量用户的涌入给MiniMax计算资源造成了压力。

MiniMax官方公告

于无人之境前行,于逆境中求优解

MiniMax,这家公司名字颇有考究。在数学与博弈论中,MiniMax代表“极小化极大”指代一种决策思路,即在最坏情况下寻求最优解,这与公司创始人闫俊杰的创业想法不谋而合。他就是要踏上一条没人尝试且充满艰难险阻的未知旅程,在里面找到正确答案。

2022年初,闫俊杰在上海正式成立MiniMax。当时,与AGI关联的通用大模型尚未进入VC/PE投资视野。嗅觉灵敏的云启资本,在MiniMax成立不久投了天使轮。云启资本合伙人陈昱看好MiniMax的AGI方向,同时多模态技术路线也被云启内部视为高风险决策。很多投资人没有听懂闫俊杰对于创立公司要做什么的描述,但云启资本认可闫俊杰的思路。

事后,陈昱公开表示,“投MiniMax天使轮是对AGI长期价值的押注。”

MiniMax成立前公司发展讨论图(公开素材)

MiniMax提出,要在AGI道路上“突围”,需要团队的技术前瞻性、对AGI的执著、务实精神。在公开报道里,MiniMax创始人闫俊杰很少与“天才”关联,却常被描述成AI领域的一位“奇才”。这种“奇”体现在,外界很难捕捉到他的脉搏,想法“与众不同”,与主流“背道而驰”。在闫俊杰看来,AI的终极目标就是服务普通人,公司的发展方向、模型和产品的迭代路径也应该以此为目标。

跟云启资本持一同押注的还有IDG资本、高瓴创投、米哈游等VC/PE、产业资本等。2022年,米哈游业绩一骑绝尘,用年收入273.40亿元、净利润161.45亿元的好成绩晋升中国游戏第三大盈利公司。彼时,米哈游笃定MiniMax思路正确,联手VC/PE送上了新一轮融资。

后来的故事也证明,资本的眼光没有错。2023年,ChatGPT席卷全球,掀起AI风口,一时间,国内涌现了一批大模型公司,大厂也在研究大模型,拉开了“百模大战”帷幕。提前预判风口、做好准备的MiniMax率先站稳了脚跟,同行越疯狂,闫俊杰越清醒,远离喧嚣、深耕技术。

越疯狂,越清醒

时间来到2023年,国内“百模大战”打得火热,多数厂商选择更成熟的“密集型”模型架构以求“短平快”地推出产品。随着“百模大战”带来了机遇和风险,AI概念满天飞。

据投资家研究院统计,仅2023年国内就诞生了超80个大模型,参与公司既有百度、华为、腾讯、阿里巴巴、京东、字节跳动、网易等大厂,也有高校、科学家组成的创业军团密集入局,大模型赛道分化出了多个分支,覆盖新能源汽车、智能制造、医疗健康等50多个领域。

“中国AI六小虎”的称呼就在那一阶段形成,媒体人把MiniMax、智谱AI、月之暗面、百川智能、零一万物、阶跃星辰六家公司拼成了中国AI大模型的新生代图谱。各家融资不断,国内战场拼杀激烈。但相比其它5家公司,最早看出风口苗头的闫俊杰,却始终低调。

公众视野里,MiniMax的公开融资信息甚少,使得它们逐渐脱离了媒体视野。事实上,在外界狂欢的日子里,MiniMax将公司绝大部分算力资源投入到当时被认为训练不稳定、商业化困难的MoE架构研发中。这一决策在当时备受质疑,但背后其实是团队对行业“天花板困境”的深刻洞察。与此同时,构建了“B端+C端”双轮生态,不要声量,反向加大研发与产品投入。这种做法让MiniMax显得格外“不合群”。

事后看,这一坚持得到回报。2023 年下半年,MiniMax率先投入大量资源解锁MoE构架;2024年 1 月,MiniMax正式上线abab 6,成为国内首个MoE大模型; 2024 年 4 月,推出abab 6.5系列混合专家MoE语言模型,开创了用 MoE 架构进行大规模商业化部署的先河。此后,MoE架构彻底取代稠密架构,成了大模型领域技术迭代的新方向,直到2025年年初爆火出圈的DeepSeek,MoE正式进入大众视野。

海螺王者归来 MiniMax多模态上牌桌

2024年,随着Sora横空出世,OpenAI陷入创始团队与股东的权力角逐。国内,经历“百模大战“AI圈发现热钱不再那么好拿,创业故事也开始面临投资人的灵魂发问,什么时候止损什么时候开始盈利。

MiniMax同样面临质疑,文本模型效果被诟病,商业落地难度大。在媒体的早期印象里,“MiniMax很危险”,“闫俊杰过于执着”。面对外界的疑问,MiniMax选择用公开发布会的形式来正面回答。2024年8月的MiniMax Open Day,是公司创业以来举办过一次线下发布会,此前媒体平日得到的“一手消息”只能从官方公众号获取。

就是这次发布会,让公众看到了平日低调的MiniMax与全球用户日均30亿次交互,是国内token调用量最大的AI公司。也同样是这场发布会,让海螺视频正式走向公众视野。直到今天,仍有不少发布会的观众对现场展示的MiniMax第一个AI视频作品——《魔法硬币》记忆犹新。

MiniMax 伙伴日现场播放《魔法硬币》视频

一边是多模态模型领域的快速凸起,一边是文本领域的天降奇兵。2025年整个上半年,国内外基本把流量给了DeepSeek。VC/PE行业对大模型投资产生了很大分歧,一部分投资人喊出,“中国大模型只看DeepSeek一家就够了。”这句话差点吓坏了大模型创业者。“VC/PE一夜间不敢投大模型了。”不少同类AI创业公司更被曝出产品线调整与战略收缩。

6月17号,MiniMax“技术发布周”拉开序幕,系统性地展示了在文本模型、多模态及应用层面的综合技术实力。文本模型M1在长文本处理领军全球,视频、语音模型的大版本更新,通用智能体和海螺视频智能体的首次亮相奠定了MiniMax在“模型—应用—智能体生态”战略。海螺视频与语音模型的爆火,让MiniMax坐稳国内唯一的“全模态之王”之位。

2025世界人工智能大会(WAIC 2025) MiniMax展台

相较于一些仍高度依赖单一产品或主要依靠融资来维持高昂研发投入的同行,MiniMax已建立起一个多元化且经过市场验证的营收结构,已是国内少数实现跑通商业化闭环的AI公司。一个健康的财务模型,是说服公开市场投资者的最硬通货。

M2踹开资本市场的“临门一脚”?

时间回到十月最后一周,MiniMax迎来新一次全模态发布周,其中开源文本模型M2,充分验证了其“长期主义”的成功。这是继M1发布四个月后,MiniMax在开源大模型方向的又一次快速迭代。

作为一款面向Agent和代码场景的大模型,M2一经上线,便在全球权威测评榜单Artificial Analysis (AA)中取得全球第五、开源第一的成绩;在LMArena Web Dev 全球第四,超过了Claude 4.5;智能水平接近GPT-5(high)与Claude Sonnet 4.5等顶级模型,成为迄今为止针对智能代理与工具调用任务表现非常的开源模型。

伴随M2发布的,是其颠覆性的价格:单位成本不到同级竞品Claude 4.5的8%,并面向全球限时免费,“直到服务器扛不住为止”。这不再是简单的价格战,而是一场旨在瓦解“算力税”、推动AI普惠的战略举措。

上线3天,M2登上OpenRouter全球调用量第5、国内模型第1,HuggingFace Trending榜单第1,访问量的持续攀升让平台一度因访问过载出现短时波动,服务成功率在29日下午降至约90%。经过公司紧急系统扩容后,才恢复至约99%的稳定水平。这才有深夜道歉信的故事。

随着AI行业进入深水区,资本市场的评估标准也在悄然改变。投资者的热情从最初对技术参数和估值的狂热追逐,转向对商业模式、盈利能力和长期价值的冷静审视。在这一背景下,关于“中国大模型第一股”的讨论日渐升温。

通过MiniMax M2这一缩影,我们看到了一种可能性:在人工智能这场关乎人类未来的终局之战中,胜利或许不只属于那些拥有最庞大军团的帝国,也可能属于那些选择了正确路径、并以惊人定力走下去的“远征军”。

当然,以MiniMax为代表的国产AI企业面临的挑战依然巨大。无论是尚未完全解决的“幻觉”与“对齐”技术难题,还是日益激烈的国际竞争环境,国产AI前方的道路依然布满荆棘。

相关内容

热门资讯

原创 哈... 最近,以色列军方以哈马斯武装人员在拉法地区发起攻击为由,对加沙进行了空袭。以色列声称,这一行为导致了...
原创 一... 作者 | 云帆 “因访问量激增,远超我们的预期,下午线上服务的成功率降至90%,我们对由此带来的不便...
豆神教育:AI教育产品已应用文... 证券之星消息,豆神教育(300010)10月29日在投资者关系平台上答复投资者关心的问题。 投资者提...
建信基金刘克飞:科技板块关注重... 中证报中证网讯(记者 张凌之)10月30日,建信港股通精选混合基金经理刘克飞在中国证券报“金牛来了”...
蓝驰创投:AI 破晓前,最早动... 迷雾被层层拨开。 正如蓝驰创投今年人民币基金合伙人大会的主题—— " 东方既白 ",承接着去年 " ...