我用8种AI给物理学家打分,之后取总分,最终获得了一个相对客观的物理学前50名排行榜。
打分之前先要制定打分规则,我跟AI长时间讨论如何衡量一个物理学家的贡献,最后凝练成了5个打分点:
第1个打分点:框架的颠覆性(0~100分)。
物理理论可以分为4个层次。
第1层“框架的颠覆者”,例如相对论颠覆了绝对时空框架,量子化颠覆了连续性框架,不确定性原理颠覆了决定论框架。
第2层“框架内统一”,例如,麦克斯韦统一了电/磁/光、朗道的相变理论 把铁磁/超流/结构相变 纳入同一框架、SU(3)味对称统一了强子谱,等等。
第3层“框架内完善”,例如引力波的发现 完善了广义相对论,希格斯机制 完善了标准模型等等。
第4层“近似经验发现”,例如开普勒三定律 只对天体数据拟合出规律,但是不知道这些规律的深层原因。
这四个层次,得分从高到低。
第2个打分点:原创性和独立性(0~100分)。
狭义相对论诞生在1905年,即使爱因斯坦1904年去世,人类也大概率会在5年内把它搞出来,因为庞加莱等人已经很接近搞出狭义相对论了。但是广义相对论就不同了,同时代几乎没有竞争者。没有爱因斯坦,广义相对论很可能要至少晚几十年。所以广义相对论比狭义相对论,在原创性和独立性上的得分更高。
因此可以通过搜索同时代有没有相似的竞争者去衡量一个物理理论的原创性和独立性。例如在牛顿之前,胡克已经意识到了引力和距离的平方成反比。
1926年,薛定谔和海森堡几乎同时提出两种等价的量子力学数学表述。
1964年,有三个独立的小组几乎同时提出希格斯机制。
这样的例子还有很多。物理学大部分理论都有相似的竞争者,都是时代的产物。因此在物理学永远是时代造就了天才,而不是天才开创了时代,天才唯一的作用是加速了时代。比如说爱因斯坦让人类提前5年发现狭义相对论(个人观点)。
其实在其他领域也一样,是时代造就了马云,而不是马云创造了电商时代,马云的唯一作用是让电商时代提前3年到来(个人观点)。
第3个打分点:影响的持续性(0~100分)。
比如玻尔的原子模型只存活了13年就被薛定谔方程取代,而薛定谔方程到现在差不多100年了,还在支撑着凝聚态物理和原子物理的发展,所以他的得分自然更高。
这是很多物理理论的持续时间:
一个理论对物理学的影响时间越长,得分越高。
第4个打分点:有没有为物理学带来新工具或新方法(0~100分)。
比如望远镜、微积分、粒子加速器、路径积分等等。大部分物理排名都高估理论物理学家,轻视实验物理学家。设置这个打分点有利于公平对待实验物理学家和理论物理学家。
第5个打分点:是否在多个分支都有贡献(0~100分)。
比如麦克斯韦在电磁学、热力学、光学等多个分支都有贡献,而开普勒只在天体运动学这一条分支有贡献。所以麦克斯韦得分自然比开普勒高。
比如说这是ChatGPT的打分,最后把5个分数加起来排名。
这5个打分点的权重其实不应该一样,框架的颠覆性权重应该更高,比较合理的比例应该是2:1:1:1:1。我试了好几种权重组合,对前三十名排名影响不大,于是就用了最简单的“1:1:1:1:1”。
只考虑有实验证据的理论,不考虑弦论这种没有实验证据的假说。
只考虑物理学家,不考虑 诺特、拉格朗日等数学家,也不考虑 亚里士多德这些哲学家。
这8个AI分别是:ChatGPT、谷歌Gemini、Deepseek、豆包、Kimi、Grok、秘塔、百度。
这就是8个AI对所有50人的打分排名:
这个表格最重要的是分数,不是排名。不要只看排名,这一点非常非常重要。由于AI打分有误差,因此如果两个人分数差20分之内,说明这俩人是同一个水平;如果差40分以上,差距才明显。例如,麦克斯韦和伽利略,他俩只差3分,说明他俩对物理学的贡献一样大。费曼和普朗克只差10分,他俩对物理学的贡献也一样大。但是伽利略比费曼高40分,这说明伽利略对物理学贡献肯定大于费曼。泡利比居里夫人高46分,说明泡利对物理学贡献肯定大于居里夫人。
伽利略和法拉第为什么排名那么高?
如果把物理学看成一个国家,伽利略就是现代物理学的太祖,他奠定了实验和数学结合的研究范式。
法拉第在任何物理排名里面都在前10名,因为他不仅发现了电磁感应定律,还梳理整合了各种电、磁现象,为麦克斯韦奠定基础。最重要的是,法拉第创造了“场”的概念;“场”的概念深刻的影响了后面物理学,像麦克斯韦方程组、广义相对论、量子场论,核心都是“场”。
任何一个物理学排行榜,如果前10名没有伽利略和法拉第,都是野榜!
AI排名的缺点
任何关于物理学的排名都不严谨,这个AI排名也不严谨。AI的训练数据来源于互联网,其中充斥着不准确信息,大众误解和各种偏见会扭曲排名。另外AI存在语言效应:你用中文问AI,杨振宁排名就偏高;你用法语问AI,居里夫人排名就偏高。
当然AI也有优势,AI掌握的数据量远远多于个人,因此AI的评价更全面。我仔细看过至少20个物理学排行榜,包括朗道指数排名、物理世界在1999年的投票排名等等。这个AI排行榜相当于把20多个排行榜融合在了一起,至少90%的人大致排名没问题。
另外这个排行榜还有一个重要作用:这50个人覆盖了物理学几乎所有的领域。如果里面有你不认识的人,说明你的物理学知识存在盲区。比如说盖尔曼、温伯格、安德森是谁?为什么排名那么高?这个排行榜能让你知道你物理学知识的盲区到底在哪。因此这个排名科普,比知识科普价值更大。
杨振宁的排名为什么那么高?
很多人只考虑规范场,其实宇称不守恒也是一个非常大的贡献(杨振宁在宇称不守恒里面贡献约40%,李政道约60%,个人观点,暂时不考虑吴健雄)。相对论颠覆了绝对时空、量子化颠覆了连续性、不确定原理颠覆了决定论,宇称不守恒也颠覆了对称性,宇称不守恒能给杨加不少分。
很多人拿泡利也发现过 非阿贝尔规范场,去降低杨振宁的贡献,这是不公平的。假如牛顿独立发明微积分,跟牛顿、莱布尼茨共同发明微积分,几乎不影响后世贡献评价。希格斯也是3个独立小组发现希格斯机制,但是丝毫不影响后人对希格斯的评价。毕竟杨振宁是第一个正式发表。(杨-米尔斯理论里面,杨振宁大约贡献了80%、米尔斯20%,个人观点)。
杨米尔斯理论 之于标准模型,大概相当于 洛伦兹 之于狭义相对论,都给出了正确的数学形式,但是最开始的物理应用都是错误的,而洛伦兹都能排物理学20名。
朗道指数。朗道对物理学家进行打分评价,
0级:牛顿。
0.5级:爱因斯坦。
1级:玻尔、海森堡、狄拉克、薛定谔、费米、德布罗意等。
2级:朗道、费曼等。
里面为什么没有杨振宁?朗道大概在1950年左右制定的朗道指数,朗道1968 年去世;但是规范场在物理学的统治地位在1970年之后才被确立;朗道没法预判 规范场的基础地位,所以朗道在1950年左右 提出朗道指数的时候自然没有 杨振宁。这个问题相当于问,爱德华·威腾(弦论)、温伯格为什么不在朗道指数里面?
1999年英国《物理世界》杂志举办了“千禧年最伟大物理学家”投票,130位物理学家投票、每个人5票,总共有61位物理学家在榜上,为什么杨振宁只有1票?
130个人,每个人5票,总共就是650票。
前10名占据了大约500票,剩下的51人分剩下的100 多票,平均一个人 两票左右。15名之后,大多数人都是1~3票,没有区分度。温伯格只有2票,霍金只有1票,洛伦兹只有1票,有29位物理学家只获得了 1票。1999年投票的时候,汉斯贝特是当时在世的 得票最高的人,只有3票。杨振宁只有1票,也不奇怪了。这个投票,没有区分度,绝大多数票都集中在前10名。这个投票只能证明一件事,杨振宁不在前10名里面。
最后总结一下,我个人认为AI把杨振宁排14名,偏高,但不是很离谱;我个人认为杨振宁肯定在前30里面,大概率在20名左右。
温伯格为什么排名比杨振宁低?Weinberg最大贡献是 电弱统一,属于“框架内统一”的工作,“框架内统一”得分很高;但是 电弱统一不是他一个人完成的,是三个人共同完成的。Glashow提出以 SU(2)×U(1) 为框架并预言“中性流”;Weinberg把希格斯自发破缺放入该框架、写出可计算的极简模型;Salam独立提出了几乎相同的理论。很多人把电弱统一都归到Weinberg头上,是不是太偏袒了?温伯格是标准模型的领导者、组织者,但是温伯格大的贡献少,小的贡献多(例如中性弱流、弱混合角、W/Z 的性质等小贡献多)。当然,单论标准模型,温伯格贡献肯定大于杨振宁。但是,杨振宁还有2D Ising、杨–巴克斯特方程,这些小半诺奖的成果;再加上宇称不守恒40%的成果。 总体上来说,杨振宁对物理学贡献肯定大于温伯格。很多人认为温伯格排名高,一个重要的原因是 温伯格写了一本不错的量子场论教科书。 再说说hooft,hooft最大贡献是 重整化的工作,重整化 既没有对框架颠覆、也没有框架内统一,只是一个框架内完善的工作(计算量极大,硬算出来的)。因此,我个人认为:hooft对物理学贡献 明显不如杨振宁和weinberg。Hooft的全息原理,因为没有实验证据,所以这部分没有得分。
肯定有很多人,对AI给出的排名不满。其实吧,这篇文章最核心的是,这5个打分规则,能非常全面而深刻的衡量一个物理学家的贡献。
我个人认为这个AI排名里面,玻尔兹曼应该更高一点,温伯格应该更高一点,盖尔曼应该变低一点,居里夫人应该变低一点,波恩应该更高一点,南部阳一郎应该更高一点。 你觉得这份AI排名里谁被高估了?谁又被低估了呢?请在评论区给出你的观点。
最后上一个“神图”: