自发布以来,热度居高不下,集成了的产品竞争也日趋白热化——谷歌于7号发布下一代对话AI系统Bard,微软也于8日上线了集成的新必应搜索引擎。而百度、阿里、网易、科大讯飞等国内互联网企业则争相释出正在研发或即将发布类似产品的消息。
相较以往的自然语言处理模型,究竟有多大的突破性?如果很大,为什么国内外头部科技企业都声称自己已研发出类似产品?如果不大,为什么它会爆火?更重要的是,未来它是否真的会取代目前的搜索引擎?
相比其他模型,的技术突破有多大?
据开发方(美国知名人工智能实验室)介绍,使用基于GPT-3.5架构的大型语言模型,这使其语言理解能力更强。此外,它可以使用多种语言进行交互,还能够联系上下文和语境给出回复,并根据用户的语料进行训练和调整,使回复更符合用户的需求。
和以往的语言模型不同的是,它能够记住并理解用户在此前对话中输入的内容,这对语言模型来说是较大的技术突破。“在机器的语义理解中输入的句子越短,逻辑越简单,机器的正确性就越高。但如果要把我们整个会话都记住,而且理解新问题对整体对话带来的意义改变,这是一个很困难的事情。”中科深智创始人兼CEO成维忠说。
除此之外,的基础架构之一是有监督学习的深度学习模型。成维忠向南都·AI前哨站解释道,此前更为主流的大型语言模型算法的训练方式是非监督训练。而在无监督学习出现后,大部分科技公司就采用了这个新方式,不再使用成本更高的有监督学习。
“本来大模型、预训练,路子是无监督训练,不断填数据就行了,算法参数越来越大,效果越来越好。但到了,忽然要加有监督微调,要加人工反馈,要加强化学习,看上去有点像‘瞎搞’,但非常大胆。”
因此,成维忠形容“有点像是走了回头路”——“把过去的一些大模型训练之前的方法拿来用了,比如说对其进行人工干预和强化训练,其实是蛮突破性的。”事实证明,这一技术所需的人工成本更高,但效果更好。
“在某种意义上,这其实是对过去一味追求(参数)大和追求无监督学习的一个路线修正。”京东集团副总裁何晓冬曾对媒体表示,相较之前大量使用无监督深度学习算法,模型背后的算法和训练过程更加新颖。如果没有人参与数据甄选,模型参数即便大十几倍,也很难达到如今的效果。
为何科技巨头争相下场?谁将取得先机?
然而,的“爆火”可能并非全部出自于技术上的创新。
清华大学人工智能国际治理研究院副院长、人工智能治理研究中心主任梁正指出,在出现之前,已经有许多语言模型面世,提高了用户的接受度,大语言模型的发展应用逐渐发展到了临界点。而的出现意味着这种模型“从能用到好用”,打开了商业的想象力。
“就像人脸识别一样,”他进一步解释,2016年之前,人脸识别的准确率比较低,“当时我们做调研,如果人脸识别的准确率不到90%是不会有人用的,因为纠错的成本太高了。去年12月出来,一开始也只有专业圈子的人在用,后面发现质量还可以,才打开了规模化应用的尝试。”
在成维忠看来,的成功与其开放和用户的交互不无关系。他提到,此前发布的GPT1-3系列只是进行了技术发布,没有提供用户交互的应用,所以用户们比较难有直观的使用感受。
借着技术发展和规模化应用的东风,似乎找到了最合适的商业化道路,各大巨头纷纷闻风而动。
2月7日,谷歌宣布将推出下一代对话AI系统Bard。谷歌首席执行官桑德尔・皮查伊表示,“很快你就会在搜索中看到 AI 支持的功能,它可以将复杂的信息和多个视角的信息提炼成易于理解的格式。”
紧接着,微软官宣由支持的新版必应搜索引擎和Edge浏览器。微软首席执行官萨蒂亚·纳德拉在接受媒体采访时表示,“搜索行业整体目前正面临巨变。这样的机会很少会出现。”他称,这一次,谷歌作为当前领先者的优势将变得不再那么重要。
国内的百度、阿里、网易、科大讯飞等也争相释出正在研发或即将发布类似产品的消息。还有消息称,苹果也将举行与AI有关的峰会,主题可能就是和。
会取代目前的搜索引擎吗?
实际上,早在刚刚出现之时,就有关于其是否会颠覆搜索引擎的讨论。2022年12月,摩根士丹利投行的首席分析师布赖恩·诺瓦克就在一份研报中提到,语言模型可能会占据市场份额,并破坏谷歌作为互联网用户入口的地位。
是否真的会取代搜索引擎?多位专家对南都·AI前哨站表示,的搜索结果还存在很多问题,短期内无法替代搜索引擎。
“以谷歌为例,目前它的信息资源相对来说还是比较精确的,而它也对必应的挑战做出了相应的回应,推出了自己的聊天机器人Brad。”中国社会科学院哲学所科技哲学研究室主任段伟文指出,以为代表的对话应用语言模型目前存在着以数据质量问题为代表的种种问题。
“如果语言模型的数据质量很糟糕,或者是数据本身有价值观问题,比如歧视和偏见,那么在用户和人工智能使用问答方式沟通的时候,由于它的回答是整合之后的,而不是像搜索引擎一样会呈现多条搜索结果,它带来的价值观风险就会更大,可能会出现信息拼凑、编造的问题。”
梁正也指出,在学术研究上,对于搜索有增速的作用,可以根据需求和关键词反馈匹配的结果。但他实测发现,在专业领域上面临的搜索难度依旧较大。“它可能会给出来一些不准确的信息,搜索就必须要花更多的时间筛选其给出来的答案。”
今年年初,北美密歇根大学哲学系教授 就遇到了这个问题:他班上一名学生使用写出了一篇在他看来“全班最好的论文”。最终他决定改变他的课程论文写作方式,要求学生们使用受访问限制的浏览器,并且在教室里完成初稿。在提交初稿后,学生们还必须解释每一次修改的理由。
这位教授遇到的问题并非孤例。由于带来了越来越多的学术造假,美国纽约市教育部正式禁用,以保护学术诚信。此外,纽约市、巴尔的摩县、弗吉尼亚州的劳登县和阿拉巴马州的蒙哥马利县也开始限制学生访问。而全球不少学术期刊出版社明令禁止或者限制其下的作者使用,其中包括全球顶尖科学期刊《》《》等等。
此外,的回答可能会受到不同地区风俗、文化,乃至于法规的影响。段伟文认为,为了调和不同的价值观,语言模型的开发者将倾向于回避矛盾、冲突和分歧,而这可能导致少数群体在客观上受到忽视。
另一方面,根据用户实验和的公开资料,的训练数据来自2021年及以往的互联网数据,具有滞后性。“一个算法的训练,不可能是完全开放的、没有标准的。只有把它做成相对比较封闭的训练,把训练数据标准化,训练效率才高。”成维忠告诉南都·AI前哨站,这也使得短期内难以对搜索引擎造成冲击。
采写:南都记者胡耕硕