这意味着,每一个职位所需要的技能,都需要被标准量化。比如“请结合实际经历,谈谈你是如何在新环境中融入团队并适应学习或工作的”,关注的是候选人的“抗压能力”和“学习反思”能力。
近屿智能CEO方小雷认为,胜任力模型是目前人力资源领域最科学和底层的基础方法,这些维度和标签是根据企业咨询和真实面试案例梳理制定,据此制定AI面试考察的方向。
除了配置某个岗位需要考核的能力,万森还会根据不同能力的重要性来调整不同的分数占比。
当岗位的素质模型确定后,在内部测试中,万森所在的部门会向该模型输入去年收到的简历及面试视频,标注已录取的候选人,“让机器去学习我们的喜好, 告诉它回答到哪些方面能拿到高分。”
而求职者在AI面试得分的高低,就取决于和模型的相似程度。
万森介绍,读取语言部分的信息,只是人工智能收集的一部分信息,视频中非语言信息也会成为判分的依据。例如,人工智能可以根据谈话的语速、语调来判断性格特征;或是根据面部表情来判断情绪。
在全部面试完成后,万森所在的部门会人工观看每一个岗位面试评分的前十名和后十名。通过对比机器和人工的评分结果,一旦出现严重不匹配的情况,该岗位会重新进行测评,但他说“目前还没出现重测”。
从面试结果上看,AI面试没有淘汰人,只是给出了建议,最后依旧是人工选择进入下一轮面试的人选。但据多位HR反映,他们不会看所有的视频,会直接淘汰排名靠后的人选。
“会有遗珠,肯定是有一些优秀的人没办法通过AI筛选出来”,但万森也承认人事部门不会为此花上几百个小时去寻找,他们只需要找到这一批候选人中88%的精英就够了。
把自己当成“机器人”
求职者们在不断失败中反思自己,也在各大社交平台上搜寻“讨好AI秘笈”。
叶子为第二次AI面试做了更加充足的准备,这是一家头部快消公司的管培生岗位。
叶子录下了练习视频,发现自己面对镜头时表情很拘谨,不自然,眼神经常飘去其他地方;遇到卡壳时会有小动作,声音颤抖。
为此她早早预约了图书馆的研讨室,叶子把自己准备的答案背得滚瓜烂熟,做好表情管理,练习语速流畅,以及让声音保持饱满的感情,还对着镜子练习了微笑。
和叶子一样,李斯特也在失败中不断自我怀疑。
李斯特是英国一所大学的市场营销专业硕士研究生,她的秋招开始得更早,求职方向是快消外企、奢饰品、零售和地产方向。8月3日,她投递了第一份简历。截至目前,她参加了15场AI面试,通过了5场。
李斯特的秋招投递表格。受访者供图
11月1日下午参加的那场奢饰品行业的AI面试,让李斯特摸索出一个简单且重要的结论,这可能也是她之前10次都失败的原因。
“盯着手机摄像头亮起的绿点。”
当天晚上快九点,李斯特收到了AI面试产品平台工作人员的电话,询问她有没有时间参加第二天的群面,并告知她的AI面试得分特别高,求职公司的HR希望能够尽早见到她。
“我之前所有说的内容都是差不多的,结构化面试的题目是很相似的,唯一的区别就在于我那一次死盯着绿色的点,而之前都是看屏幕中的自己。”
这是李斯特前一天在AI面试技巧帖子的评论区中看到的,有网友说自己做了这样的测试。“没有任何官方信息告诉我们眼睛盯着的地方对整体分数影响,所以导致前面很多家公司我没有与真人沟通的机会了。”
一开始,李斯特尝试跟机器人聊天。“因为招聘的公司不会完全承认自己只看测评分数,部分HR说他们真的会看内容的,我早期抱着幻想。”
她试图把对面当成真人,用一些轻松的语气开一些玩笑,以及口语化的表达。但迟迟没有下一轮通知,让李斯特意识到这样不行,“分数不够高,HR看不见你。”
把自己当成“机器人”,去迎合人工智能的评分标准,李斯特开始尝试用机器化的方式去回答问题。
比如AI面试官问,“举例说明面对复杂问题时,如何定位关键点并找出解决方案。”
李斯特能够识别出这是想要考察解决问题的能力。在真人面前,她会直接从亮点说起,然后根据面试官的兴趣展现自己的能力。在AI面试中,李斯特只能按照时间线的顺序回答。“第一件事是梳理资源,第二件事是展开调查,第三是把已有资源量化,第四呈现具体方案。”她感觉自己逐渐从一个立体的人变成了平面的人。
一切都以机器的喜好为先,但有时候李斯特搞不清楚机器喜欢什么。比如当AI面试官问,“当你需要严格按照一个政策或规定,而这个规定对你来讲是不方便的,你会怎么做?”
如果在跟真人聊,李斯特会强调自己的灵活性,既尊重这个规则,但也会很灵活的去处理。但在面对AI的时候,“我不确定AI是更注重我的灵活性,还是更注重我是不是一个守规则的人。”
算法的判断可靠吗?
事实上,AI面试官的“能力”取决于多种因素,不同公司的算法逻辑也不尽相同。
一位人工智能领域的专家认为,目前AI面试产品并不是一个成型的行业,只是人工智能应用的一个场景,因此缺乏统一的行业标准,更多是根据客户的需求进行开发,“比如有的需要题库多,有的需要灵活,谁说了算?谁说了也不算”。
在“多面AI面试”中,市场部负责人叶小舟介绍,决定结果有效性的主要有两点:首先是构建数据模型时,机器学习的输入数据量和其有效性,其次是人类面试官对结果反馈的准确性。多面AI面试是学习人类面试官判定规则,如果人类面试的结果不准确,那多面AI面试结果的有效性就无法保证。
而在“AI得贤招聘官”中,AI面试官的语义分析水平,决定着对候选人回答内容的解析准确度。近屿智能CEO方小雷解释,就是让人工智能理解话语,理解“一个句子放在一句段话中的意思”。
如果AI面试产品处于“关键词分析算法”阶段,通过提取候选人回答文本中的关键词,来评判候选人回答问题的好坏,方小雷认为面试结果“会产生误判”。“(某个回答)堆砌很多词藻,命中很多关键词,但它是言之无物的,算法用一个加减乘除的公式表达,这种时候分数都是会出现问题。”
在方小雷看来,只有达到“篇章级别的理解”的程度,才能说AI面试的结果是有效的。简单来说,“篇章级别的语义识别算法”就是让人工智能理解“一个句子放在一句段话中的意思”。
AI面试视频中的语义、语音和面孔图像是三种完全不同的信号源。除了对候选人的回答内容进行分析,AI面试还会对求职者的表情、声音等非语言部分进行分析。
但方小雷称,AI面试产品很难识别微表情。他认为,目前心理学上对微表情的研究并不充分。比如一个人的眼睛朝左看一下是在回忆,但也有大量的人在想象时,眼球也会向左转动,因此不能作为判断的标准来训练机器。他说现阶段表情识别只做到“宏表情”,也即判断开心、悲伤、愤怒、厌恶、恐惧等几种明确的表情。
“命中率”高,也即同一个候选人的人工评分和机器评分的一致性高,是大部分AI面试产品用来评估有效性的方法。市面主流的AI面试产品官方数据显示,人工智能面试官的筛选出来的结果相对准确。比如“多面AI面试”的判断结果与人工判断结果的吻合率达90%以上。在大规模的面试场景中,近屿智能的“AI得贤招聘官”的正确性远超人类面试官的平均水平。“海纳招聘AI面试”则声称精准度高达98%。
上述人工智能专家提到,“机器学习不管过程”。即使作为开发者,也只能从结果推论出求职者大概怎样做才能取得高分,但他也无从得知求职者说出哪些关键词必定会加分;或者要以怎样的语速和语调,或保持怎样的表情神态作答才能满足AI的要求——因为AI评分是连同用字及表情等多个项目分析得来的结果,并非如语速适中就会加分般简单。
这背后是AI深度学习模仿人类的神经网路,当中牵涉庞大的复杂计算。香港中文大学计算机科学与工程学系系主任金国庆教授曾在接受采访时形容,深度学习的过程就像人类学习踏单车,虽然不能描述出如何保持单车平衡,但只知道反复练习便能学会这项技能。
AI面试官的学习方式就是,收集大量的候选人样本数据,并人工标注打分,将其输入机器。系统学习了经人类分析的资料后,会自动把新输入的资料(面试片段中求职者表现)和结果(反映出的性格)联系起来,比如一些使用一些积极的词汇,代表着候选人的性格积极等。
在万森看来,AI面试存在着明显的优点。比如机器的统一标准能规避人类面试官的主观性判断。万森曾做过一项研究发现,面试官更倾向于录取与自己同校的候选人。而当面试官精力有限,比如工作了4小时或更长时间以后会出现“疲劳审视”,也会影响对候选人的判断。
方小雷也认为,AI面试的高效率可以给所有候选人一个公平的机会。如果一个岗位收到了1000份简历,可能真人面试官在面试100人里面就已经找到了合适的,这意味着后面900个人会被自动淘汰。
但万森也承认,“AI很明显还没有达到人的智慧”。初筛需要完成的是求职者的特质和岗位之间的初步磨合,因此他们不会在这个环节问很复杂的场景式问题。
不是所有的岗位都适合AI面试。万森曾经遇到过一些非常优秀的程序员,由于不善言辞,在AI面试中的评分很低。他所在的公司经过权衡后,技术类岗位由笔试进行初筛,“毕竟AI不能帮你解决所有事。”
这个看起来更省事、更加公平的工具也让一些HR充满困惑。
宋威是一家第三方人力资源公司的项目经理,曾为某公司招聘大量客服人员,在他看来,人工智能也许可以筛选出表达和沟通能力良好的人,但是没办法对候选人的态度进行判断。
另外,他还担忧,AI面试可以判断一个人的综合能力,但它可能无法感知一个人的内心世界以及最深的人生动力。
AI会改变我们吗
“在系统中翻滚”,图图这样形容她的秋招。参加AI面试的同学们大多有这样一种感觉:求职的人就像一批产品在流水线中循环,仅凭系统根据复杂的计算筛选出标准化产品。
而当AI面试重复太多次,“结构化面试的一套答案就会成为肌肉记忆”,大脑一听到关键词就形成条件反射。
AI面试强调一致性而非多元化。李斯特觉得,所有应届生进入职场的过程,就像公司在筛选最适合的工具的过程,而且大部分公司都是只需要螺丝钉的,它不需要个人的。AI面试中确定的岗位特质标签,李斯特认为更应该是一种偏好,而不是一种标准,但当对方拒绝沟通时,她就没有办法输入个性化的东西。
“思维僵化”,当李斯特的AI面试和真人面试同时进行时,她很明显地感受到这一点。
那是一个汽车公司市场岗位的最后一轮面试,面试官为岗位所属事业部的HR,面试官的提问恰好也类似“宝洁八大问”。李斯特几乎迅速地搬出应对AI面试官的那一套框架来,就像背答案一样。