极目新闻记者 李碗容
通讯员 高翔
一夜之间,刷屏社交媒体。将给人们带来哪些影响?哪些行业会受到其冲击和影响?国内外人工智能发展的差异?人工智能发展的边界在哪?对此,极目新闻记者对话了华中科技大学计算机学院副教授魏巍,他长期从事人工智能、自然语言处理、信息检索、文本数据挖掘等相关研究。魏教授认为,从某种程度上标志着感知智能向认知智能迈进。
广告会计做账培训_零基础到企业实操_一站式培训
×
华中科技大学计算机学院副教授魏巍(受访者供图)
聊天解决“牛头不对马嘴”
极目新闻: 大火,您使用过吗?
魏巍:去年11月,刚出来的时候我曾尝试过。刚开始使用时感觉还是比较震撼的,和它聊天很愉快,几乎不会有“答非所问”的感受,类似人类间的自然交流感觉。最近使用时,这样的感受更加强烈,跟它交流起来越来越像人类间的正常交流。
对话的本质是交谈双方能够相互理解对方表达,同时能够给出准确恰当的回复。其中的难点就在于理解对方用自然语言表述的需求,在这一块做得很棒,它能够快速准确地理解人们用自然语言表达的需求,并快速生成恰当的回复,这种回复并非简单枯燥的文字,而是具有一定逻辑和趣味性的回复。除此之外,它还能快速完成一些资料采集和文字生成工作,比如营销文案的生成等,这些能力刷新着人们对能力的认知。
广告
胆小者勿入!五四三二一…恐怖的躲猫猫游戏现在开始!
×
使用截图
极目新闻:是如何做到交流如此顺畅?
魏巍:这主要得益于具有的超大规模预训练语言模型GPT3.5。GPT3.5利用高质量人工标注的问答进行微调,并通过人类反馈的强化学习向模型内部注入人类偏好。相比之前的模型,目前的GPT3.5不仅使用了巨量的参数(1750亿参数),还使用更大规模的文本语料(含有3000亿单词),并且在语料中混合了代码。GPT系列模型则在巨量语料上进行大规模自监督预训练,从而具有获取文本形式的世界知识和语言建模生成的能力。
具体而言,研发团队首先对生成的多个结果按人类偏好进行排序,标注了一批这样的数据来提前训练一个额外的奖励模型,随后使用该奖励模型直接对生成的结果打分,并反馈给,让其生成更高分数的回复。
极目新闻:有人说回答很“圆滑老成”?
魏巍:是的,不过要明确目前大部分人工智能对话系统是不会预设情感倾向,它不会有人的相关性格表征。它的回答其实都是基于GPT模型,用户出现这样的感受,可能来自GPT模型在训练过程中使用了万亿级规模的经过人类编辑的文本数据集,如新闻、营销文案等。从而使得大模型的数据分布不平衡,进而出现数据带偏问题。同时训练中利用人类反馈辅助也使模型生成的回复更加接近人类的回答,因而进一步提升了其生成答复的智能性。
未来会继续向前发展,应该会变得更智能。亿级用户在使用时,对于本身也是一个优化迭代,它会根据用户的问题以及对其回答的反馈继续做优化。
极目新闻:我们看到网上在讨论用写论文的可能性。
魏巍:需要注意的是,的答案是合乎情理甚至是有趣的,但是不一定是准确的。聊天时,只用给出一些合乎逻辑的答案就可以了。但是如果你要进行一些专业性问答,它不一定能给你非常准确的答案。我看到国内部分学术期刊最近也发表声明,隐瞒使用情况将被退稿或撤稿。
人工智能发展,简单劳动或将被取代
极目新闻:的发展,让很多人担忧会不会面临失业风险。
魏巍:随着人工智能发展,一些行业从业者的确会受到冲击,比如简单的文案收集整理工作,原来可能需要好几个一起去做,但是人工智能能以极高的效率完成,那也就不需要那么多人了。一些重复性劳动、需要大量人力的简单劳动可能会被取代,但是创造性、专业性强的劳动是很难被取代的。不过在垂直领域,如教育、医疗等,拥有巨大的发展前景,比如提供教育领域的个性化辅导等。
极目新闻:对人工智能发展意味着什么?
魏巍:是人工智能发展的一个阶段性成果,极大地推动了认知智能的发展。人工智能分为几类,从最初始的计算智能,这一阶段计算机用于数据处理。感知智能阶段,人脸识别、自动驾驶等都是感知智能实际运用的体现。下一个发力方向应该是认知智能。
是认知智能的一个典型应用,在以往感知智能为主导的人工智能应用外,实现了认知层面的突破。这也是目前人工智能技术从弱人工智能到强人工智能过渡的一个必然阶段。简单理解来说,只有达到认知智能,人机交互才能得以实现,机器人理解人类的想法,并做出对应指令。
不过从本身来说,其并没有很好解决回答严谨性的问题,以及用户查询多样性与回答唯一性和准确性之间的矛盾,比如询问今天苹果的价格,可能是日常食用用的苹果价格也可能是苹果手机的价格,两种理解都可能是真实的用户查询意图。如何解决用户查询多样性与回答唯一性和准确性之间的矛盾,还在探索阶段,可能自动文摘是一个潜在方向,但是也很难根本上解决上述问题。这也表明认知智能领域,我们还有很大的前进空间。
广告投放地域[蚂蚁HR]公司人事外包_企业用工专业机构平台
×
使用截图
极目新闻:也有人担心人工智能发展,未来会威胁到人类安全?
魏巍:这个问题要辩证看待,实际上目前的人工智能技术并没有发展到大家所担忧的那个阶段,离真正的自我演化的具有自主意识的强人工智能还有较大差距。
人工智能伦理问题一直受到学界业界和政府部门的关注,相关研究和规范也一直伴随人工智能的发展在不断完善,比如我们所熟知的自动驾驶技术,通常都限定在封闭道路路段进行。我们目前需要注意的是,随着的继续发展,后期类似于个人隐私保护、知识产权保护等更多伦理问题会被大家所关注。
广告
从秘书起步,十年内无人超越,以一己之力力挽狂澜成就一段传奇
×
使用截图
对中国版要有信心
极目新闻:我们国家能做出类似的应用产品吗?
魏巍:这一产品在技术层面底层大模型训练上没有太多技术上的秘密可言,类似GPT系列的大规模预训练语言模型,国内一直在研究和开发并在不断完善中。目前,国内的很多高校都在联合业界头部企业积极开发,前期已经有不同版本的中文大模型推出。随着技术日益成熟,国内相关大模型也一定会迎头赶上,日趋完善。毕竟国内的互联网用户数以及人工智能从业人员,为相关技术的开发提供了大量真实用户数据和数据标注人员。
的研究价值和商业价值已逐渐得到国内大部分专业人士的重视和认可,因此中国版的推出只是时间问题。不过,短期内的产品性能是否能够如目前的这么惊艳,可能还需要时间进一步验证,但我们应该有这个信心。
极目新闻:和国外相比,中国人工智能发展得怎样?
魏巍:我们就目前已有研究来看,中国在人工智能领域发展是有优势的,移动互联网高速发展,我们有庞大的用户群体以及由此带来的海量用户数据。
在人工智能领域的计算机视觉方面,我们国内研究水平和国外持平,甚至在某些领域还有一定的领先优势。很多研究成果已经产业化,比如大家所熟知的人脸识别、票据识别、自动驾驶等。不过在自然语言处理领域,我国并没有很多很好的应用案例,以往的应用还较初级,且大多应用于垂直领域方面,比如电商平台的客服机器人、营销领域内的智能电话机器人等。但未来这一领域,如上文所述,我们国家会继续探索,也应该会取得不错的成绩。
极目新闻:会对人工智能领域的科学研究带来哪些影响?
魏巍:出来对工业界和学术界的确有很大的影响,不论是国内还是国际,大家的研究方向可能在不久的将来都会有相应的调整。比如随着研究的深入,如何实现高效的的计算体系结构、存储结构,以及结合认知能力的计算机视觉应用等都是新的方向。
目前可能预见到的是在大规模预训练语言模型方面,会出现激烈的竞争态势,类似于手机操作系统OS系和系等。但是大模型的训练确实投入很大,不太适合很多小公司或者研究机构。因此在这之上,会出现很多基于大模型的人工智能应用和研究出现,同时也会泛化到其他领域。比如和机器人的结合,可以预见在不久的将来,在人工智能领域和相关衍生行业会出现更多令人影响深刻的应用和研究成果出现,有可能是一个百花齐放、百家争鸣的新生态体系出现,我们都很期待。