chatgpt对智能音箱的影响中国信通院：ChatGPT爆火，我们会掉队吗？如何防止AI作恶？

默认分类2年前 (2023)发布 admin

4,050 0 0

作为第一个消费级人工智能（AI），聊天机器人风靡全球。那么，相对于之前的AI，有哪些突破，AI的突破性进步对人类意味着什么？我们是否需要担心它作恶？在这一轮AI竞赛中，中国会掉队吗？

对上述问题，记者近日专访中国信通院云计算与大数据研究所所长何宝宏。他认为，与以往类似聊天机器人相比，的智能化程度的确有大幅提升，其文本交互能力接近于人类水平，具体又表现在具备强交互、强理解和强生成三大能力上。

以为代表的AIGC（利用人工智能技术生成内容）技术将促使AI产业迎来拐点，进一步带动生产力变革。背后的大模型技术及应用范式，将极大冲击现有人工智能产业研发路线，发展方式或将迎来新拐点。但从目前使用情况来看，类的人工智能应用也带来诸多风险挑战。

以下为采访实录：

为何轰动？

国是直通车：就计算能力与现有的技术而言，是什么级别？其技术牛在哪？

何宝宏：这是第一个消费级AI爆款。是第一款面向消费者的AI应用，主要功能为与用户进行智能化的聊天对话，属于偏任务型的多轮对话和问答系统，是公众第一次亲身体验现代人工智能的强大功能。

背后主要是由GPT-3.5大模型支持。作为第3.5代GPT模型的衍生模型，充分发挥了监督指令微调（）和从人类反馈中强化学习（RLHF）等技术作用，能够理解多轮对话，表现更接近人类。因此，它比2016年“阿尔法狗”战胜世界冠军更具有轰动效应。我对数字技术“7年之痒”规律性的阐述，再次在AI领域得到验证：7年左右必须得变，要么升维，要么变型，要么消失。

国是直通车：的出现，是否意味着人类距离实现量产类人机器人的梦想又前进了一步？

何宝宏：与以往类似聊天机器人相比，的智能化程度的确有大幅提升，其文本交互能力接近于人类水平，具体又表现在具备强交互、强理解和强生成三大能力上。强交互性表现在通过多轮对话，其可以对过往聊天内容进行再学习，在对话中不断改进输出文本的质量；强理解能力表现在能够分析用户模糊的语言，准确理解用户意图，辨别对话中不正确的提问，拒绝不适当的请求；强生成能力表现在可以按照要求生成用于不同场景、不同形式的文字，包括邮件、小说、论文和代码等，据报道已通过美国行医执照、研究生考试等。

国是直通车：能够带来比更大的冲击波，实现的条件是什么？是否受限于算力，或最终受限于硬件？

chatgpt对智能音箱的影响中国信通院：ChatGPT爆火，我们会掉队吗？如何防止AI作恶？

何宝宏：的实现离不开大算力加持。对其研发和运营的投入是巨大的，目前训练高度依赖于微软Azure AI超级计算机支持，另据估算，训练一次成本约为460万美元。此外，运营成本高昂，按照百万级别用户量计算，每月运行成本约为300万美元。

会让人类大规模失业吗？

国是直通车：会让哪些商业前景、哪些领域从业人员受影响？有些人担心自己未来会因其失业，这种担心是否多余？

何宝宏：技术突破性的进展会带来产品与应用的变革。最直接的就是，推动人机交互方式进化，继而会推动人机对话在智能客服、智能音箱、智能车载等众多场景的不断深化应用，使得相关行业客服效率提升、人力成本降低。另外，将助力AIGC探索落地，包括在软件代码编写、工业设计、分子结构预测等科研生产领域探索应用，帮助缩短研发周期、降低试验成本。

目前以为代表的AIGC主要还是辅助人类，方便人们快速、灵活地生成内容。未来如何利用具备创新性的工具进行原创创作，将成从业者的核心竞争力。

国是直通车：未来会怎样发展？将对人类带来哪些变化？

何宝宏：以为代表的AIGC技术，将促使AI产业迎来拐点，进一步带动生产力变革。背后的大模型技术及应用范式，将会极大冲击现有人工智能产业研发路线，发展方式或将迎来新拐点。根据美国知名投资机构a16z和创始人Sam 的分析，大模型的重要性不亚于底层基础软硬件平台，将在未来人工智能产业格局中发挥类似基础设施的作用，大量上层应用不再单独研发智能算法技术，只需调用大模型接口。

智能化的人机交互模式带来了巨大想象空间。与“阿尔法狗”的最大区别在于，它有可能改变每个人的信息获取方式。

会作恶吗？

国是直通车：计算技术的实现需要借助于硬件，是否可以理解为，人类始终有一把“钥匙”可以把技术可能给人类带来的伤害“锁上”？或者说，不必对或将来可能出现更厉害的技术过分担心？

何宝宏：存在两方面的问题：幻觉和的危害。

AI幻觉指模型过于自信，生成的内容与提供的源内容无关或不忠实，有时会出现听起来合理，但不正确或荒谬的答案。与此同时，随着应用增长，人们会对AI产生越来越多的信任。幻觉来自两个方面，一是训练数据本身，二是训练方法。AI是通过海量数据训练出来的，因此这一缺点也与大数据的问题一样：数据很精确但错得离谱。

围绕的新一轮有害信息和犯罪，已经在路上。AI伦理、算法偏见、信息茧房、侵犯版权、网络诈骗、网络暴力、种族主义、性别歧视等，一个也不会少。另外，自称不得表达政治观点或从事政治活动，但已有的一些回答案例很明显有“它”的倾向甚至价值观。还有，不管实际理解或事实内容如何，内容审核者都会偏好更长的答案，不管质量，先拿字数凑。

chatgpt对智能音箱的影响中国信通院：ChatGPT爆火，我们会掉队吗？如何防止AI作恶？

国是直通车：有研究者担心在等生成式人工智能的新一波创新竞赛中，会步搜索引擎、社交媒体和大数据商业的后尘，使得诚信、隐私、知识产权等伦理和法律上的权利和基本价值观沦为牺牲品。您怎么看？

何宝宏：从现在的使用情况来看，类的人工智能应用已经带来了诸多风险挑战，对此国家相关法律政策也在陆续出台。随着社会持续关注，人工智能等新技术的发展和治理也越来越受到重视。建议组织跨学科团队，深入研究等新技术应用对现有法律规范、伦理道德等带来的冲击，系统梳理潜在风险挑战，及早研究相关风险防范措施。鼓励各方积极参与人工智能安全技术研发、防范体系搭建和治理规则制定等工作，加快布局我国人工智能安全标准、伦理规则的研究。

中国会被落下吗？

国是直通车：热度飙升，近几天百度、谷歌不约而同宣布推出类似项目，是蹭热度还是有其他考量？在这方面中国公司整体上实力如何？

何宝宏：近期，随着持续火热，全球范围内都对以为代表的AIGC应用抱有更高期许，凭借其智能化人机交互方式有望成为互联网新入口。当前，互联网信息获取方式主要是搜索和推荐，具有显著差异，不再仅仅是对信息内容的呈现或推送，而是对已有信息内容消化理解后的再生成。

这一范式的变化，引起了全球互联网行业高度关注。微软宣布将能力与必应搜索（Bing）、办公软件（）等进行深度集成。据报道，谷歌管理层已经发布“红色代码”警报，全面应对带来的“威胁”，正紧锣密鼓地测试一个名为“学徒巴德”（ Bard）的聊天机器人。

我国大模型底层技术布局薄弱，虽然已涌现一批大模型，但均从谷歌提出的等基础模型衍生而来，当前大模型底层技术、基础架构均由国外头部企业掌握，且部分模型不开源仅提供接口服务，我国技术存在“卡脖子”隐患。

在这样的背景下，谷歌和百度宣布推出类似项目，我认为这是企业自身的商业逻辑，同时也为大家提供了更多选项，我作为用户乐见其成。另外，谷歌、百度等企业在大规模语言模型这一技术领域有着较深技术积累，一些前沿技术已经服务于我们所熟悉的翻译、智能客服等场景，至于这次推出新项目的效果，让我们拭目以待。

国是直通车：以百度多年来在AI领域的技术积累，其即将面世的类项目，在大模型的可靠度、数据质量、应用场景和商业模式方面，与相较，可能的优势和劣势有哪些？

何宝宏：推出仅仅2、3个月时间，用户数量快速增长，毫无疑问已经占得了先机，但针对这类新技术的应用场景或商业模式探索，整体上仍处于早期阶段，目前还面临技术成熟度不足、成本高等各种问题，并且如何与现有治理体系相协调也要进一步研究。对于一项新技术，人们常常会高估其短期价值，而低估其长期价值。长远来看，我认为无论是的，还是百度的“文心一言”，在技术、产品方面还有很大提升空间，未来才是真正值得我们期待的。

国是直通车：英文数据库信息汇聚全球数据信息，这一优势可能是中文数据库难以企及的，中国的AI厂商应如何定位？未来要想拓展全球市场，需要如何进化和迭代自己的技术和产品？

何宝宏：数据被认为是人工智能三驾马车之一，构建高质量的数据集对于训练人工智能系统重要性不言而喻。近年来，我国企业、高校、研究机构都在数据集上做了很多工作，整体上看存在一定差距，但客观上这是一个长期工作。

越来越多人认为人工智能产业格局会发生变化，一部分AI企业会往下走，发挥基础设施作用；另外一部分企业会往上走，专注于解决行业应用问题。这对于中国乃至全球人工智能企业而言，既是机遇也是挑战，关键在于企业自身决策。

（国是直通车微信公号）