对话朱松纯:中国的AI叙事关乎国运
创始人
2025-04-18 18:46:19
0

出品|搜狐科技

作者|杨锦

在大模型的热闹之外,朱松纯不惧做一个少数派。

他认为,科学本质是用简约的模型解释复杂的现象,比如杨振宁、爱因斯坦这些科学家,他们构建世界的模型里可能只有一两个参数。而今天的大模型,动辄百亿甚至千亿级的参数,还不可解释,“从这个角度看,确实是非常丑陋的。”

但他也承认,从工程的角度来讲,大模型又能够在某些方面产生比较好的结果。

他和北京通用人工智能研究院(通研院)及北大几位老师最新合编的图书《通用人工智能标准、评级、测试与架构》,针对通用人工智能提出了系统的标准、评级、测试与架构体系,对大模型也适用。

什么是智能?怎么样才算是通用了?在这套评测体系下,智能体不仅要完成任务,还需要自主定义任务,这意味着,智能体没办法像在其他评测体系上一样“刷榜”。

过去20年,刷榜像附着在人工智能发展史上的藤壶,他本人也曾长时间地站在数据驱动和刷榜的一线。2004年,朱松纯和另一位全球计算机领域顶级科学家沈向洋,在他的湖北家乡创建了莲花山研究院,是最早规模性地做大数据标注的机构。

刷榜是针对性地做端到端训练,而通用泛化的任务,是一个无穷的任务,比如训练机器人学会抓杯子,这很快,但问题是,稍微换个位置、改个重量、变个尺寸,它又不认识了。

打掉无数个榜单之后,他开始觉得,这是一个“任务陷阱”。这个路,可能是走不通的。

朱松纯目前担任北京通用人工智能研究院院长,北京大学人工智能研究院、智能学院院长。

作为国际知名的计算机专家、统计与应用数学家、人工智能专家,朱松纯曾在国际顶级期刊和会议上发表论文300多篇,解决了“什么是纹理”的底层科学问题。又分别在31岁、35岁和39岁的时候,三次问鼎计算机视觉领域最具声望的马尔奖。

一个登过顶的人,在遍览众山小后,从山上走了下来,不再爬山、更不想爬树。他想登月了。

2017年,朱松纯提出了“小数据、大任务”范式,核心是“给机器立心”,让智能体可以自主性地构建物理的感知,因为这是在数据中看不见的。

在这个理论体系下,通研院训练出了由价值、因果驱动的智能体“通通”,只用了10张显卡。整个通研院,也只有一两百张卡。

到今年,“通通”的智商和情商相当于一个五岁左右的小女孩,能够在一定程度上理解周围环境,有自己的个性,会耍赖、撒谎。

来源于《通用人工智能标准、评级、测试与架构》

相比之下,在一些测试中,大模型能通过人类司法考试,在数学、编程、法律等学科的表现接近人类博士平均分,在医学考试中的正确率能够超过大多数医学博士考生,看起来似乎厉害多了。

但朱松纯认为,AI会解几何题、能打螺丝,这些是专业能力,不是通用、泛化的能力。做出来的答案,可能是蒙的,也可能是刷题或者死记硬背的。有着认知架构的通用智能体,可能现在幼稚,却有自主性和成长性。

他一再呼吁,中国要形成自己的AI叙事,不能一味地跟随硅谷的模式,堆算力、堆数据,要找到一条自己的路线,做原创性的研究。

“我们要非常严肃认真地对待通用人工智能的问题,它不是一个只是炒作的热点话题。真正的通用人工智能还没有起来,还需要接着投入,这是真正关乎到我们国运的选择。”

以下为对话精编:

搜狐科技:注意到您对大模型的态度似乎有一些变化。之前在杨振宁先生百年诞辰活动上,您曾说大模型是非常丑陋的,很难通向AGI,但是您最新主编的这本通用人工智能的测试标准书,把大模型也覆盖进来了,另外通研院也开始在大模型上构建通用智能体的认知和决策体系,这个转变的契机是什么?

朱松纯:当时是谈科学的美,因为对于科学的美来说,整个理性的科学从20世纪黄金和白银时期,你看杨振宁、爱因斯坦这些人,他们构建世界的模型里面可能就只有一两个参数,咱们现在的模型可能几十亿甚至上千亿个参数。

物理模型要解释那么复杂的现象,它只有几个参数或者一个参数,从科学的角度来讲,大道至简,用越简约的模型来解释越来越复杂的现象,这是科学的本质。

大模型不光参数太大,还解释不清楚。搞深度学习的人都不清楚那个模型里面到底是个啥东西,没人能解释,Transformer这里面的表达也是完全无法解释的,所以从这个意义上讲,它肯定是很丑陋的。

但是从工程的角度来讲,它又能够产生比较好的结果,这一点我们不能不承认。

搜狐科技:为什么要把大模型纳为评测目标?目前中美头部大模型的测试结果怎么样?

朱松纯:肯定是要把它作为其中的一种智能系统,因为我们要把所有(种类)智能体都要放进来测,有的是它能够刷一个功能,有的刷很多功能。有的没有具身,我们就给它配个目前最好的身体给它测,从测出来的结果来看,效果确实是不太好的。

搜狐科技:您之前提得比较多的是UV函数,然后您今天讲CUV,这个C是指什么?

朱松纯:就是它的认知架构,它脑袋的复杂度有多大。比如说有一个图像,每个人看的东西都不一样是吧?假设我把人所有能看到的东西综合起来,那就是人的认知的极限了,有可能未来机器看到的比所有的人看到的还多。

这就是C,认知架构,它的英语是“Cognitive Architecture”。我们说C的进化,就是指它能够看到越来越多的节点了。

搜狐科技:对我们小数据、大任务的范式,外界似乎也有一些质疑。

朱松纯:有人说,是不是因为科学的方式在转换,你们是不是掉队了?也有人说你们是不是思想保守?如果数据是一个表层的现象,它是被里面的一些核心的诉求所驱动的怎么说话、怎么做事呢,如果你去拟合表层的东西,你就要很多参数,因为你是去拟合很高维的空间,但是如果你搞清楚了它底层的诉求,你就可以解释很多现象。

这就是我们说的要追求一个简化的模型,这也是为什么我们提CUV架构,我们还是希望不断地追求美和简约。

搜狐科技:您听到这种声音会生气吗?

朱松纯:根本就不需要生气,每个人的出发点都不一样,大部分对这个东西质疑的人,就是属于那种做实验刷榜刷惯的人。

我们刷榜刷了20年了,在20年过程中,已经形成了一个思维定势和习惯。就是说你给我拿一个代码,在哪个数据上让我测一下,试一下能不能work,这就是一种典型的思维。我就感觉很好笑。

相关内容

热门资讯

关联MCN公司谈司马南偷税:他... 界面新闻记者 | 赵孟 蔡星卓 界面新闻编辑 | 刘海川 2025年3月21日,国家税务总局北京...
小米AI眼镜突传消息!多股涨停 值得注意的是,此前多次有爆料称小米将打造AI眼镜,预计在3月至4月发布。 3月24日,AI眼镜板块领...
珍爱网回应闭店:全面核查整改,... 图片来源:视觉中国 3月24日,珍爱网发布《消费者权益保障工作声明》称,近日,个别合作商运营问题引发...
原创 李... 近日,李嘉诚拟向美国贝莱德财团出售43个港口。据媒体报道,双方已经谈妥了所有细节,贝莱德集团高层计划...
3月17日基金净值:前海开源瑞... 证券之星消息,3月17日,前海开源瑞和债券A最新单位净值为1.0433元,累计净值为1.2293元,...
聚焦“AI焦虑”“AI幻觉”,... 人工智能(AI)技术近年来发展迅猛,已迅速蔓延至各个领域,尤其是今年初,国产DeepSeek大模型的...
3月17日基金净值:前海开源公... 证券之星消息,3月17日,前海开源公用事业股票最新单位净值为2.7367元,累计净值为2.7367元...
爆冷!戴维斯30分利夫26+1... 【搜狐体育战报】北京时间3月11日CBA常规赛第39轮,卫冕冠军在上半场领先的情况下惨遭逆转,最终主...
华为大动作,高手看好AI医疗概... 本周,市场风格出现高低切换,市场炒作新热点,如阿里玄铁芯片、AI智能体、军工、小金属等,而一些老热点...
如何在CentOS上设置共享桌... CentOS共享桌面配置指南 在服务器管理与运维场景中,CentOS因其稳定性和开源性被广泛使用,对...