记不清这是第几次面对她了。这位有着标准职场形象的女性,在整个秋招季里,几乎与许晴的求职邮件如影随形——这是她的AI面试官。九月以来,许晴已经参加了近20场AI面试,但每一次她面对的,几乎都是同样的枯燥场景。
眼前的这位AI面试官,脸上始终挂着平静的微笑,并不会因许晴的表现改变神色,也不会与她有任何多余的互动。只会在她答完一道题后礼貌地点头,再用机械的女声发出指令,“好的,我们进入下一题。”
许晴性格开朗、能言善辩、热衷挑战,把面试视为一场与面试官的较量。面对真人时,她并不怯场,高压的氛围、刁钻的提问,反而能激起她的战斗欲望,帮助她快速转动大脑,生成最恰当的回答。面试官被震慑住的表情,她百看不厌。
但面对AI时,这份表达欲被吞没了。许晴深知眼前只是一团没有生命的算法,那个妆容精致的面试官,连嘴角上扬的弧度都不曾变化,这让她觉得没劲。
更何况,在许晴看来,AI面试官也并不专业,它抛出三五个问题,尝试探究面试者的性格、能力、经历。但对许晴来说,这些问题空洞且缺乏针对性,根本不能展现她的优点。
这一次,她终于忍无可忍,面试中途便退出程序,让这个假人从眼前消失。
像许晴这样与AI周旋的应届生,在秋招季里还有很多。近两年,许多应届生在求职时突然发现,自己要面对的第一道关卡,从真人HR变成了AI面试官。他们难以理解,为什么明明自己满怀诚意,却连真人面试官都见不到?
另一端,每到校招季,用人单位面对“堆积如山”的简历,寻找一个缓解工作压力、提高招聘效率的工具,也是应有之义。如今,AI工具快速迭代,他们有理由相信,用AI面试官代替此前人工初筛、“初面”,是平衡效率和准确率的理想答案。
可对不少求职者来说,AI面试的评价逻辑并不透明,这些假人往往难以捉摸。他们不得不反复揣测其中门道,只为让自己的简历再前进一轮。
人工智能驱动的招聘流程,机器人面试官在分散的简历和网络图表机器人中向候选人展示数据。图源:IC photo
被AI筛选
向企业投递简历后,会先收到一份能力测评问卷,里面包含言语理解、资料分析、图形推理以及性格测试等题目,共130多道,“能力测评过了,才能进行AI面试。”
这是今年参加秋招以来,许晴反复经历的剧情。她是上海财经大学的一名研二学生,因为有过国外交流的经历,她将求职的重点目标定为上海的外企。投递了一圈简历后,许晴发现,回复邮件的外企几乎都要求她先参加AI面试。
“原来AI已经发展到这种程度了吗?”许晴不禁诧异,此前她从未听说AI还能面试人。她在社交媒体上搜索了一些经验帖,一番浏览之后,许晴对AI面试有了基本的判断:不同行业和岗位的问题可能略有不同,但都比较基础,追问也不深,不会深挖面试者的经历,“应该只是走个过场,不会真正刷人。”她稍微放松了警惕。
很快第一次AI面试就来了,那是一家法国电气企业的销售工程师岗位的招聘。当天在宿舍里,许晴身着便装、素面朝天,用手机点开企业发来的链接,页面跳转到了面试系统,前置摄像头被打开。验证了身份信息后,AI面试官出现在了屏幕里。
那是一位留着干练中短发,身着浅色西装的女性,形象与真人别无二致。伴随着许晴的回答,AI面试官还会若有所思地点头、摇头,并不时报以微笑。
这让许晴有些始料未及,在她最初的设想里,AI面试顶多只需要自己打开摄像头,在AI的语音或文字指引下回答问题,“没想到会有一个人物形象。”
在参加一家智能科技国企的招聘时,就读于厦门大学的研三学生谢意也见到了这位AI面试官,“比我想象中更逼真。”
她看过许多短视频里的虚拟主播,但是这位女性在画面上更为精致,语气也更加自然,“像电台主持人。”乍一眼,谢意甚至没有发觉自己面对的是个假人。只有在对话时,对方毫无起伏的音调和始终标准的微笑会提示她,眼前只是一个程序设定好的虚拟形象。
谢意不由得紧张了起来。此前她觉得,AI面试官只是企业为了招聘而临时搭建的工具,不会问出多高质量的问题,“至少比不上ChatGPT。”因此在做准备时,她并没有把AI当成一个高明的面试官。然而此刻,AI面试官似乎比她想象中要更聪明,这让她心里没底,“我会不会小看了AI?”
这场面试是由一道不计分的热身题开始的,谢意被要求先简单介绍自己的家乡。随后正式的5轮提问开始,题型是常见的行为测试和性格测试,每道大题后还有一到两道追问。整场面试持续了约四十分钟,谢意回答了近十道问题。
其中,谢意被问到:“当你在工作中遇到信息来源不同、相互矛盾的情况,你会怎么办?”
这道题在她的意料之中,前一晚她已经准备好了回答思路——这是一道常规题目,可以结合自己的实习经历来作答,既有真实素材可依据,还能突出自己的实践经验。
谢意马上想起暑假时,自己在一家国际公关公司实习时的经历。当时,她发现公司的一位客户——一家外企的不同分部间因意见分歧发生争执,后来被她成功化解。于是,她迅速总结出一段书面语,在两分钟内完成了作答。
但意外出现了。AI面试官向她追问了更多细节:这家外企内部产生分歧的具体原因,以及自己平衡双方冲突的详细过程。
这让谢意措手不及,她没想到AI会如此细致地分析她的回答,并提出针对性的追问,“可能我刚才回答得还不够充分,AI想更挖掘更多细节。”
她只能把双方的具体需求补充了一遍,并告诉AI,在化解矛盾的过程中,她分析了问题、设计了问卷、制定了方案,并在两方之间协调、沟通。
但实际上,这段经历并不像她讲得那般出彩。当时,她只是在客户的文书材料里发现,该企业分部并没有根据总部的要求更新方案,而她只需要向分部重新明确一下, “自然而然就解决了。”其中,企业内部并不存在多大的矛盾,自然,她也没有在两方之间周旋的“壮举”,这是不得已之下,她编撰出来的部分回答。
如果是真人面试,谢意可以向面试官坦白,她缺乏这部分经历,然后引导面试官换个角度提问。但AI面试不能换题,她只能硬着头皮往下答。
她推测,AI面试官想考察她的分析判断能力和沟通协调能力,“梳理文书材料、发现问题,体现了我的分析判断能力。”于是,为了再突出自己具备沟通协调能力,她把原本简单的沟通过程说得更加丰满。这是她所想到的,能够迎合AI的方法。
摸不透AI面试官的应届生不止谢意。在社交媒体上,许多应届生都疑惑,“AI到底是怎么评价我的?”
黑箱一般的评价标准,让许多应届生在进行AI面试时,像是在面对一个看不见的敌人。他们只能根据以往参加真人面试的经验,以及对AI功能的简单认知,形成一套可能有效的应对方法。
也有求职者觉得AI面试更加简单。社交媒体上,许多应届生分享经验,都强调只要实事求是地讲述,把时间说满,并且回答得层次、有逻辑,就很容易通过。
有人靠着这些技巧,整个秋招季里AI面试未尝败绩。也有人说自己性格内向,面对假人反而更没有心理压力。
“要踩中某些关键词,这可能是AI的采分点,还要答得有逻辑性,因为要考查学生的思维能力……”谢意总结。
但这次AI面试还是没过。谢意参加的5场AI面试,都在回答完最后一道问题后石沉大海。她不知道是哪里出了问题。
AI人工智能机器人在做面试官面试人类。图源:IC photo
用AI筛选
相比求职者,用人方显然更容易接受这个新事物。当下,不少企业为缓解毕业季繁重的校招压力,引入了自动化的AI面试工具。他们将招聘标准融入人工智能,相信算法能为企业筛选出最合适的人才。
张竹是北京一家中小型外企的人力资源服务经理,工作之余,她会利用职业经验,给应届生做面试辅导。这两年来,她新增了AI面试培训这项业务。
“使用AI面试的企业越来越多了。”张竹回忆,去年秋招期间,她辅导的十多位应届生里,只有一半经历过AI面试,但今年“每个人都参加过至少两次AI面试了”。
今年,张竹所在的公司也用起了AI面试官,这是整个招聘流程里的第一个环节,“用来初步考察求职者的英语口语能力。”通过后,才能与业务部门约面。
引入AI面试官后,人事部门找了许多常见的英语面试问题,并从语音语调、流畅度、清晰度等方面拟好了评分标准,将二者“喂”给AI。
面试时,面试者会随机抽到三道题,用英语回答,随后由AI打分。每道题都是五分制,综合评分达到三分即为通过。
而出于严谨考虑,所有AI判定通过的面试录像,还会再被复核一遍,以避免AI判断失误——这是整个初面环节里,唯一需要人工的部分。
“实在忙不过来。”张竹坦言。引入AI前,公司人事收到简历后,会先向求职者提问一个英文问题,求职者录下自己的回答,将语音文件发回,再由人事听取和评分。高峰期时,张竹的部门一天要处理上千份简历,自己一天便得听上两百多条录音。
这种老方法还存在一些问题,“求职者很容易作弊,回复意愿也不高。”张竹发现,求职者往往隔了半天才把语音发来,其间有充分的准备时间。许多语音文件过关的求职者,正式面试时却原形毕露。同时,这种形式也稍显繁琐,求职者都不太配合。
如今,AI的即时问答基本杜绝了作弊的可能,也会让求职者觉得,“这是一场正经的面试。”
更重要的是,复核工作难度较低,实习生便能完成。由此,张竹得以从繁琐的工作中解放出来,去处理更重要的事务。
徐莹也认为,企业为了提高招聘效率而采用AI,再正常不过。
她是深圳一家科技公司的招聘主管。近三年来,公司每年校招期间都要收到三万份左右的简历,仅凭人力根本无法全面初筛。因此,2023年,公司判断AI技术已经成熟,便采购了一套AI面试系统,用于一些简历投递量较大的岗位。
这套AI能够做到的,不再只有简单的口语考察。在它的运行逻辑中,面试者被层层解构,分解为院校、专业、学历等关键词,学习能力、逻辑能力、沟通能力等基本素养也可以被精准量化。最终,面试者成为一个个具体的分数。
“这些都是公司要考察的元素。”徐莹介绍,在这套AI的系统里,开发者已经针对不同岗位,准备了相应的题库,每道题目都是对面试者某一方面信息的探究。比如在对性格的考察中,是否喜欢户外运动、是否乐意向他人求助、参与团体活动的频率等,都是可能出现的问题。
每次招聘工作开始前,徐莹的团队都会向AI明确,公司要挑什么样的人,“比如算法工程师,要求具备较强的逻辑能力和创新能力”,AI便会在面试过程中,随机提取出相应的题目,呈现给面试者。
“类似的问题问个三五个,足够让AI对一个人形成清晰的认知。”这符合徐莹多年的从业经验,在她看来,人的某些特质本就可以被洞悉,他(她)过往经历或言语表达都是赫然的证据。
况且,她已经习惯将面试者拆解为满地碎片,再从中挑选出最重要、最亮眼的几块,像搭积木般,为公司搭建出最合适的理想人才。因此,看到AI执行的是同样的逻辑,她没有理由不信服。
使用了将近三年,徐莹发现,AI的提问过程逻辑性很强,能够满足行为面试法则或STAR面试法则,问题也很灵活,“几乎比得上一个有两到三年从业经验的HR。”
AI的优异效果也有实际的体现。引入AI面试官以来,徐莹感觉公司的新人素质显著提高。从360环评来看,新人的学习能力、沟通能力、独立工作能力的评分,“每年都有上涨。” 她认为,这一定程度上得益于AI“一刀切”的高标准。
并不像真人面试官那样,可能受到诸多因素的影响,AI是一道永远不会出错的程序,会严格地遵循公司设定的标准,绝对不会“放水”。因此在徐莹看来,通过AI面试的,都是“在绝大多数面试情景中都能通过的人。”而被淘汰的,则是“常规意义上的,不太优秀的学生”。
在徐莹的公司,AI面试的通过率大约为50%,而在人工时代,这个数字是30%。这意味着,被很多求职者怀念的真人面试,事实上可能更“严苛”。
为避免AI“看走眼”,徐莹的团队也会抽查未通过者的结果报告,检查是否有异常情况。
她抽查到的报告里,未通过者都有硬伤,要么是学历、院校、实习经历比较一般,导致简历不过关;要么是回答得不够有逻辑,综合素质评分太低。
“几乎没有误杀的。”
徐莹认为这无可厚非,公司在校招上投入了巨大成本,“当然想招到更优秀、更有潜力的人。”
11月10日,谢意结束AI面试时的页面。 受访者供图
创造一位AI面试官
陈倩是湘潭大学的一名研三学生,今年秋招以来,她参加了八次AI面试,无一通过。
她也尝试过经验帖里的方法,回答得更容易被AI接纳,甚至还化了淡妆,让自己精神状态更好,但还是颗粒无收。她很疑惑,一道预设好的程序,“是怎么判断我适不适合这家企业的?”
“AI践行的就是企业的用人标准。”徐莹知道,AI面试官承载的是用人方的意志,但对于AI具体是如何分析面试者的回答,并为面试者勾勒画像,她还是一无所知,只知道“那是大模型的功能。”
实际上,AI面试工具所展现的功能,只是大语言模型的冰山一角,它的底层逻辑甚至连开发者都未能完全一探究竟。
林艺任职的一家人力资源服务平台,从大约两年前起,开始自主研发一款AI面试工具。两年多来,作为一名后端技术人员,她像是一位老师,把一位零基础的人力资源专业毕业生,培养成了一位经验丰富的专业面试官。
这位面试官的底子是大语言模型。与市面上绝大多数AI面试产品一样,林艺公司开发的AI面试官,用的也是豆包、千问、DeepSeek等常见大模型,“只不过是商用版,准确率更高。”
其中,“题库”与“评价”是AI面试官的核心能力,需要“老师”们对大语言模型不停地灌输和教导。
“题目主要来源于专家经验和网络资源。”“专家”指的是林艺所在的团队里,拥有数学、心理学、管理学、人力资源等领域背景的员工,大多为硕士学历。他们在学术或从业生涯中,积累了行业内大量典型、有效的面试题目。再加上林艺的公司从事人力资源服务多年,积攒下来的海量资料,共同构成了AI面试官最初的养料。
除此之外,团队也会不时在网上搜罗、购买他人整理好的题目,经专家检验“信效度”后再采用。
最终,这些题目作为“锚题”,被纳入一个总题库中,成为AI面试官提问的基础。
林艺解释,锚题可以视为一道母题,是一个考察方向。在这个大方向上,题目的具体呈现方式又能有许多变换。
“比方说要考察一个人的实践经历,既可以让他直接介绍一段难忘的实习,也可以让他回忆,自己在实习过程中遇到过什么困难。”
而这个本领需要经过大量训练来习得。林艺的团队会把原理“喂”给AI,再反复地调试、测验,直到AI学会根据不同需求,问出准确的问题。
这样的智能让徐莹很安心,题目变幻莫测,面试者自然防不胜防,“即便看了经验帖,也很难猜透AI的提问逻辑。”
目前,这个AI的大脑里,已经将人类切分为了上百个考察维度,比如进取心、学习能力、沟通能力、逻辑能力、培养潜质等,“都是各行各业比较看重的一些特质。”每个维度有接近十道“锚题”,整个题库便有上千道题目。
“但‘库’的概念实际上已经不适合AI时代了。”林艺表示,随着大语言模型的自我迭代,严格来说,题目已经在AI的大脑里千变万化,无限增殖,“同样的考察方向,你不会知道题目具体是由哪几个字组成。”即便这个AI面试官由她一手调教,但她也承认,这个“学生”早已超越了她的认知。
学会了出题,还得学会评分,评价标准的制定是更为繁重的工程。开发初期,第一个版本的评价标准是由“专家”编写的。“专家”们基于自己的理论积累和行业经验,针对各个考察维度,拟写出一份“具有某种素质的人可能会表现出某种特质”的提示词。
比方说,对压力的认知、面对压力时的反思,以及为缓解压力所采取的行动等,“都是对‘抗压能力’这项指标不同维度的反映。”而提示词则相当于教材,会告诉AI,在上述维度中,很好、好、一般、不好、很差分别都对应什么表现。
至此,前期的铺垫已然完成,AI剩下要做的,便是发挥自己的本能——语义分析。面试过程中,AI会分析回答中的语义,形成对面试者的理解,并把它与评价标准反复比较,“从而确定面试者处于什么等级,并赋予相应的分数。”
而如果面试者的回答较为简单,不足以让AI对其形成清晰的认知,AI便会在原回答的基础上继续提问,直到将信息补充完整,“追问就是这样产生的。”
作为开发者,林艺清楚如何使AI像一个面试官,把人进行分类和定位;但AI是如何理解和判断求职者说的话,她不得而知,“算法的内部是个黑箱。”
社交媒体上,应届生对AI面试体验的描述各不相同。有学生发现面前的AI错漏百出,要么是把自己简历里的两段实践经历融合,编成了一段并不存在的故事;要么是无视自己的回答,问出一个已经回答过的问题。
许晴在几次AI面试中也发现,自己被问到的问题像是出自同一个题库,AI的追问也浅尝辄止,并不能切中她回答中的亮点和细节。这让她感觉,AI面试官还只是一个毛坯,便被匆匆推上了台面。
也有学生觉得,AI面试“简单得很”,分享的秘诀也五花八门:最好穿正装、眼神不要乱瞟、普通话尽量说标准……尽管他们也不能确定,自己能够通过,是不是这些努力的功劳。
市面上参差不齐的AI面试产品让林艺有些无奈,一些产品的硬件功能还远不够完善,一些同行的测评理念也“非常不专业”。
另外,考察维度不准确,评价机制不合理,都可能产生巨大的误差,“但一些产品只是写了一段提示词,直接扔给AI去打分,这样分数的浮动会很大。”
除此,一些来为公司采购AI面试工具的人事,也并没有过硬的专业素养,“完全不懂测评原理。”在林艺看来,AI面试工具目前仍处于野蛮生长的阶段,一些开发者和企业都还没有做好准备,去迎接AI面试官的到来。
尽管林艺对自家产品十分自信,但她无法确定,AI筛选出来的究竟是不是“最合适的人。”没有客户企业愿意向林艺的团队提供员工的绩效数据,他们无从得知,通过自家AI面试者,入职后的表现如何,是否符合客户企业的预期。
“其中的变量太多。”林艺说,就像不能完全用高考成绩去评价一个学生的大学表现,“企业文化、工作压力等都会影响员工的绩效数据。”因此,他们只能一再完善AI面试工具,至少保证这一环节不出问题。
8月29日,谢意收到AI面试邀请邮件。受访者供图
一个无法被打动的面试官
秋招以来,许晴已经参加了二十余次真人面试。在她的经验里,面试官的反馈对她有重要的参考价值。
“我能从面试官的神态、表情和语气来判断,自己的回答有没有让对方满意。”这能帮助她及时调整表达策略,或是及时补充信息,或是引导对方向自己的优势提问。
“这其实是在给你表现的机会,必须抓住。”她相信,如果面前的是个活生生的面试官,一定能被她的回答打动。
可面对一个毫无反馈的假人,许晴就没有开口的欲望。在一次AI面试中,AI曾要求她展开谈论,她本科担任学校外联部主席时,为社团活动拉到第一笔赞助的经历。
许晴只是笼统地讲述,自己发现了赞助商的需求,通过沟通协调,完成了这次合作。
但她没有告诉AI的是,当时那位赞助商是一位处于创业初期的个体户,想把外送业务打进校园。许晴先通过为他分析行情、制定方案,拉近了双方的距离;随后告知对方,社团活动人气很旺,会为对方的业务带来很好的宣传效果。对方被她说服,欣然转账。
“我外向开朗、能说会道的特点,对着AI都没办法表现出来。”许晴断定,冰冷的AI根本无法从中领会到她的优势,“不值得我讲这么多细节。”
陈倩也自认为是“线下型选手”。对她而言,真人面试和AI面试是两种截然不同的行动模式。
本科以来,陈倩也已参加过大大小小的真人面试。面试当日,她会早起洗漱,化个淡妆,穿上得体的衣服。在前往面试地点的路上,她也会在脑海中复盘自己准备的内容。这套程序会让她很快进入面试者的角色,从而能更加自如地发挥。
“但AI面试就像玩手机。”随处都可进行的松散感,让陈倩很难调动起干劲。
同时,AI面试似乎并没有正视应届生们的时间精力成本。就连AI面试通知也是企业通过邮箱自动发送,没有给到应届生们在艰难的求职市场所渴求的尊重。
“面试本就是一个双向的过程,企业筛选你,你也可以筛选企业。”真人面试中,面试官的言语和态度,也能让许晴感知背后企业文化和公司氛围,这有助于她了解企业、做出决策。面试结束后,面试官往往也会给出意见和评价,许晴得以总结经验,这些在AI面试中都不可能做到。
一场AI面试至少要30分钟,前期的简历准备工作也很繁琐,投入了这么多时间和精力成本,却无法让自己收获任何营养。权衡了一下性价比,陈倩决定之后不再参加任何AI面试,“更何况,双向的交流本来就是对人最基本的尊重。”
但最让陈倩不满的,还是AI面试这一形式本身的不合理——一条冰冷算法,便能决定一个人的命运。
8次AI面试经历里,陈倩都能感觉到AI面试官的粗糙。求职者本可以通过表情、语气、动作、眼神传达的精神面貌和性格特点,都无法被AI感知。在AI面前,陈倩甚至无法为自己争取或辩解,只能任由一台机器、一个程序评判,然后决定她的成败。
但徐莹对此不以为意,“大部分企业还保留着笔试环节,你甚至连说话的机会都没有,写下一个答案就被判生死。”她认为,相比这种简单粗暴的形式,AI面试好歹还能看见个“人”。
她坚信,AI面试的设置有其合理性,在初面阶段,公司本就只考察面试者的基本素养,“就像小学数学只考加减乘除,你会微积分也没用。”而且这些基本素养代表了面试者的底层能力,如果基础不过关,“也不利于公司长期的人才培养。”
而且在徐莹看来,AI面试这一形式本身,便已经发挥了一定的筛选功能。面试者如何准备和对待一场AI面试,也是其基本素养的体现。
“如果你能力很强,却因为没做好简历被筛掉,那你为什么不把简历写漂亮呢?如果你因为不习惯AI面试而没发挥好,现在网上有大量关于AI面试的信息,你为什么没有尝试去了解和准备呢?”徐莹认为,能否适应AI面试,也能反映面试者的学习能力、性格特点和求职意愿。
更何况,面试者希望在真人交流过程中,去竭力展现的特点和优势,可能都没有超出面试官的考察框架。
十年人力资源从业生涯,张竹已经不会被面试者的“亮点”打动,从而破格通过。对她而言,一位求职者的“亮点”,可能是他的开朗、机敏、好学、沟通能力等,“但这些都是能通过行为面试法挖出来的。”
“那我的诚意呢?”即便深知基础素养是通过面试的硬性标准,陈倩还是相信,自己的真诚的眼神能感动一些面试官。
“眼神真诚的学生多了去了。”张竹已经见怪不怪。
(应受访者要求,文中人物均为化名)
新京报记者 丛之翔 实习生 张启扬
编辑 杨海 校对 李立军