对话朱松纯：中国的AI叙事关乎国运_科学探索

对话朱松纯：中国的AI叙事关乎国运

创始人

2025-04-18 18:46:19

出品｜搜狐科技

作者｜杨锦

在大模型的热闹之外，朱松纯不惧做一个少数派。

他认为，科学本质是用简约的模型解释复杂的现象，比如杨振宁、爱因斯坦这些科学家，他们构建世界的模型里可能只有一两个参数。而今天的大模型，动辄百亿甚至千亿级的参数，还不可解释，“从这个角度看，确实是非常丑陋的。”

但他也承认，从工程的角度来讲，大模型又能够在某些方面产生比较好的结果。

他和北京通用人工智能研究院（通研院）及北大几位老师最新合编的图书《通用人工智能标准、评级、测试与架构》，针对通用人工智能提出了系统的标准、评级、测试与架构体系，对大模型也适用。

什么是智能？怎么样才算是通用了？在这套评测体系下，智能体不仅要完成任务，还需要自主定义任务，这意味着，智能体没办法像在其他评测体系上一样“刷榜”。

过去20年，刷榜像附着在人工智能发展史上的藤壶，他本人也曾长时间地站在数据驱动和刷榜的一线。2004年，朱松纯和另一位全球计算机领域顶级科学家沈向洋，在他的湖北家乡创建了莲花山研究院，是最早规模性地做大数据标注的机构。

刷榜是针对性地做端到端训练，而通用泛化的任务，是一个无穷的任务，比如训练机器人学会抓杯子，这很快，但问题是，稍微换个位置、改个重量、变个尺寸，它又不认识了。

打掉无数个榜单之后，他开始觉得，这是一个“任务陷阱”。这个路，可能是走不通的。

朱松纯目前担任北京通用人工智能研究院院长，北京大学人工智能研究院、智能学院院长。

作为国际知名的计算机专家、统计与应用数学家、人工智能专家，朱松纯曾在国际顶级期刊和会议上发表论文300多篇，解决了“什么是纹理”的底层科学问题。又分别在31岁、35岁和39岁的时候，三次问鼎计算机视觉领域最具声望的马尔奖。

一个登过顶的人，在遍览众山小后，从山上走了下来，不再爬山、更不想爬树。他想登月了。

2017年，朱松纯提出了“小数据、大任务”范式，核心是“给机器立心”，让智能体可以自主性地构建物理的感知，因为这是在数据中看不见的。

在这个理论体系下，通研院训练出了由价值、因果驱动的智能体“通通”，只用了10张显卡。整个通研院，也只有一两百张卡。

到今年，“通通”的智商和情商相当于一个五岁左右的小女孩，能够在一定程度上理解周围环境，有自己的个性，会耍赖、撒谎。

来源于《通用人工智能标准、评级、测试与架构》

相比之下，在一些测试中，大模型能通过人类司法考试，在数学、编程、法律等学科的表现接近人类博士平均分，在医学考试中的正确率能够超过大多数医学博士考生，看起来似乎厉害多了。

但朱松纯认为，AI会解几何题、能打螺丝，这些是专业能力，不是通用、泛化的能力。做出来的答案，可能是蒙的，也可能是刷题或者死记硬背的。有着认知架构的通用智能体，可能现在幼稚，却有自主性和成长性。

他一再呼吁，中国要形成自己的AI叙事，不能一味地跟随硅谷的模式，堆算力、堆数据，要找到一条自己的路线，做原创性的研究。

“我们要非常严肃认真地对待通用人工智能的问题，它不是一个只是炒作的热点话题。真正的通用人工智能还没有起来，还需要接着投入，这是真正关乎到我们国运的选择。”

以下为对话精编：

搜狐科技：注意到您对大模型的态度似乎有一些变化。之前在杨振宁先生百年诞辰活动上，您曾说大模型是非常丑陋的，很难通向AGI，但是您最新主编的这本通用人工智能的测试标准书，把大模型也覆盖进来了，另外通研院也开始在大模型上构建通用智能体的认知和决策体系，这个转变的契机是什么？

朱松纯：当时是谈科学的美，因为对于科学的美来说，整个理性的科学从20世纪黄金和白银时期，你看杨振宁、爱因斯坦这些人，他们构建世界的模型里面可能就只有一两个参数，咱们现在的模型可能几十亿甚至上千亿个参数。

物理模型要解释那么复杂的现象，它只有几个参数或者一个参数，从科学的角度来讲，大道至简，用越简约的模型来解释越来越复杂的现象，这是科学的本质。

大模型不光参数太大，还解释不清楚。搞深度学习的人都不清楚那个模型里面到底是个啥东西，没人能解释，Transformer这里面的表达也是完全无法解释的，所以从这个意义上讲，它肯定是很丑陋的。

但是从工程的角度来讲，它又能够产生比较好的结果，这一点我们不能不承认。

搜狐科技：为什么要把大模型纳为评测目标？目前中美头部大模型的测试结果怎么样？

朱松纯：肯定是要把它作为其中的一种智能系统，因为我们要把所有（种类）智能体都要放进来测，有的是它能够刷一个功能，有的刷很多功能。有的没有具身，我们就给它配个目前最好的身体给它测，从测出来的结果来看，效果确实是不太好的。

搜狐科技：您之前提得比较多的是UV函数，然后您今天讲CUV，这个C是指什么？

朱松纯：就是它的认知架构，它脑袋的复杂度有多大。比如说有一个图像，每个人看的东西都不一样是吧？假设我把人所有能看到的东西综合起来，那就是人的认知的极限了，有可能未来机器看到的比所有的人看到的还多。

这就是C，认知架构，它的英语是“Cognitive Architecture”。我们说C的进化，就是指它能够看到越来越多的节点了。

搜狐科技：对我们小数据、大任务的范式，外界似乎也有一些质疑。

朱松纯：有人说，是不是因为科学的方式在转换，你们是不是掉队了？也有人说你们是不是思想保守？如果数据是一个表层的现象，它是被里面的一些核心的诉求所驱动的怎么说话、怎么做事呢，如果你去拟合表层的东西，你就要很多参数，因为你是去拟合很高维的空间，但是如果你搞清楚了它底层的诉求，你就可以解释很多现象。

这就是我们说的要追求一个简化的模型，这也是为什么我们提CUV架构，我们还是希望不断地追求美和简约。

搜狐科技：您听到这种声音会生气吗？

朱松纯：根本就不需要生气，每个人的出发点都不一样，大部分对这个东西质疑的人，就是属于那种做实验刷榜刷惯的人。

我们刷榜刷了20年了，在20年过程中，已经形成了一个思维定势和习惯。就是说你给我拿一个代码，在哪个数据上让我测一下，试一下能不能work，这就是一种典型的思维。我就感觉很好笑。

数据朱松纯参数模型测试人工智能叙事国运中国通用观点评论智能体搜狐杨振宁

⚠️

本网站信息内容及素材来源于网络采集或用户发布，如涉及侵权，请及时联系我们，发送链接至2697952338@QQ.COM，我们将第一时间进行核实与删除处理。

上一篇：拥抱AI，中原“象群”加速成长

下一篇：行业“三国杀”里的饿了么：人间清醒，发力AI

对话朱松纯：中国的AI叙事关乎国运

相关内容

热门资讯