核心观点
上线后,通用人工智能、AIGC等内容成为了市场的热点,数字经济的概念也再一次获得了市场的关注。的出现代表着人工智能技术的一次重要革命,将会对数字经济的发展产生深远的影响。本文我们将从的技术演进切入,分别讨论将对数字产业化和产业数字化带来的影响,并梳理全球各国对于的态度及政策。
并非一蹴而就,依赖于坚实的技术积累。2017年诞生以来,大语言模型不断演进,基于预训练模型对特定任务进行微调的训练模式成为工业界和学术界的主流。以实现通用人工智能为目标,始终坚持自回归的语言模型路线,并不断探索模型优化的方式。使用了的训练方式,模糊了不同语言任务的边界,并使用了RLHF训练方法,极大地增强了模型的通用性能,最终实现了现在的效果。
将为数字产业化发展注入新的活力。具备较强的自然语言处理能力以及代码编写能力,因此,将其应用在搜索引擎以及人机交互领域可以提升用户搜索体验并提高交互效率。此外,等生成式AI对算力有着较高的需求,这将带动算力基础设施领域的发展建设,中兴通讯等产业链相关企业正在加快算力基础设施升级,适应算力提升的需求。
作为革命性技术将为产业数字化带来很大的增长空间。作为大语言模型,首先将对目前使用自然语言处理技术的场景造成冲击,如聊天机器人、语音助手等,也会给一些垂类场景如智能客服、智慧家居、智能教育等带来变革。通过接入的服务,这些应用的质量将得到显著提升,带来进一步的增长空间。其次,的出现也将会推动AIGC时代的到来,带动各领域AI模型的优化,文字、图像、音乐等领域的创作模式或均迎来重大变革。
我国已发布生成式AI的管理办法征求意见稿,旨在促进生成式AI技术健康发展和规范应用,而世界各国对的监管方案仍在探索中。4月11日,国家互联网信息办公室发布了《生成式人工智能服务管理办法(征求意见稿)》,《办法》中提到国家支持人工智能算法等基础技术的自主创新,并提出了一系列监管要求,主要聚焦在生成式AI提供者的责任及行为规范。意大利作为首个禁用的国家,近期态度出现缓和,称只要公司能满足清单中的要求便可以恢复在意大利的正常运行。欧洲议会激烈讨论的《AI法案》有望采取基于风险程度对AI系统进行分类管理的监管思路。美国商务部已于近日就的问责措施公开征求意见,被视作是对AI进行潜在监管的第一步。
风险因素:贸易摩擦对信息通讯产业链的冲击;国产替代进度不及预期;地缘政治扰动。
正文
去年11月30日,公司推出了最新的人工智能聊天机器人,上线仅5天,用户就超过了100万人,三个月内月活用户突破了1亿人,在网络上迅速走红。展现出了与之前的聊天机器人显著的水平差异,可以与人类进行顺畅的对话,根据提示生成特定的文案,甚至进行创作、生成代码,功能十分强大。
在上线仅不到四个月,于3月15日推出新一代语言模型GPT-4,支持多模态输入,对话质量和能力相较有显著提升。3月16日,微软推出接入 GPT-4 的办公助手 ,也推出了接入的新版本Bing浏览器;谷歌则先推出了Bard,随后开源了大语言模型PaLM的API。国内方面,各大互联网厂商也纷纷推出了各自的大语言模型。3月16日,百度发布生成式 AI 产品“文心一言”;3月29日三六零发布类大语言模型;4月11日,阿里巴巴发布通义千问,并宣布在未来接入阿里巴巴全部产品。
在的带动下,人工智能、通用人工智能、AIGC成为了市场讨论和关注的热点,市场中许多相关行业如计算机、芯片、电子等受此影响迎来了强势的上涨行情,数字经济的概念也得到了市场的关注。人工智能一直是数字经济发展的重要技术,此次的出现代表着人工智能技术的一次重要革命,也必将会对数字经济的发展产生影响。本文我们将从的技术演进切入,分别讨论对数字产业化和产业数字化的影响,并梳理全球各国对于的相关政策。
的技术演进
作为一个人工智能聊天机器人,其核心就是背后的自然语言处理算法,我们可以通过了解自然语言处理这一技术的沿革来理解的强大之处。
上世纪五十年代开始,研究者们开始投入对于自然语言处理技术的研究,最早基于语法规则实现机器对语言的理解。随后,研究者们意识到应该通过概率建模的方式来处理自然语言,研究进入到了机器学习的阶段。上世纪九十年代开始,学术界将目光放到了神经网络上。随着算力的逐步提升,神经网络的层数逐渐加深,维度逐渐提高,逐渐走向了深度学习时代。在这一时期,自然语言处理模型以递归神经网络(RNN)为主,包括长短期记忆网络(LSTM)、门控循环单元(GRU)等,这些网络实现了对文本的长距离依赖关系建模,极大地提高了模型的性能。
2017年,谷歌团队 ,Noam ,Niki 等人发表《 is all you need》论文,提出了模型,成为了大语言模型(LLM)的基础。使用注意力机制进行建模,容纳了一段文字中任意两个位置的相关性,模型表达能力强,并辅以大量的数据进行训练,得到很高的精度。同时,可以通过矩阵运算的方式来实现高效的并行运算,相比递归神经网络计算速度更快,也更加容易优化,这两个优势使其迅速在工业界和学术界被广泛使用。
随后几年,GPT、BERT、ELMo等模型被推出,模型的参数量以及训练模型所需的算力、数据量均不断增长,直接针对特定下游任务使用少量的数据对大型机构公开的大语言预训练模型进行微调()成为了自然语言处理模型训练的通用做法,也意味着大语言模型时代的到来。BERT的一个创新性的做法是使用了“完形填空”式的训练方法,即通过随机mask掉语料中的词语进行训练,增加了训练的数据量,同时也提升了模型的性能。
然而,基于预训练模型对特定任务进行微调的训练模式依赖于特定领域的有标签数据,同时,需要指定任务类别意味着不同的模型之间无法通用,长期来看,无法实现通用人工智能的目标。始终坚持自回归的语言模型路线(即只根据前置信息预测下一个位置文本的概率),并不断探索模型优化的方式。GPT-3模型的提出打破了以上的模式,提出了的训练方式,其本质是模糊了不同语言任务的边界,可以通过在训练时加入提示实现不同语言任务,极大地增强了模型的通用性能。
的前一代模型-GPT使用了人类反馈强化学习(RLHF)的训练方式,首先通过人工进行小规模高质量的有监督训练,然后再从根据第一阶段模型对反馈结果进行打分排序,训练出一个反馈模型。最后,使用PPO策略,结合第二阶段的反馈模型优化第一阶段的预训练模型,实现模型的训练。RLHF借助少量的监督数据有效地提升了模型的性能,仅使用了13亿参数就实现了GPT-3的性能。继承了-GPT的训练方式,以更大的参数量实现了更好的效果。可以看到,的成功并非一蹴而就,而是在正确的方向上不断迭代、创新的结果,是在前期大量坚实的工作基础上完成的。
与数字产业化
根据国家统计局在2021年6月发布的《数字经济及其核心产业统计分类(2021)》,数字产业化是数字经济的发展基础及核心产业,为产业数字化发展提供数字技术、产品、服务、基础设施和解决方案,其主要包括数字产品制造业(智能设备制造等)、数字产品服务业(数字产品批发、零售等)、数字技术应用业(信息技术服务等)、数字要素驱动业(信息基础设施建设等)4个大类,从这些领域出发可以探寻在数字产业化中的应用场景。
应用场景
作为人工智能技术驱动的自然语言处理工具,能够完成自然语言处理任务以及代码编写任务,因此其最直接的应用场景便是与信息资讯相关的搜索引擎领域以及与代码编写能力强相关的人机交互领域。
助力搜索引擎。微软在2023年2月8日发布使用新人工智能驱动的搜索引擎必应(Bing)和Edge浏览器,其最大的亮点在于融入了基于GPT-3.5架构开发的。之后的3月15日,微软副总裁Yusuf Mehdi发文称新必应搜索引擎已升级使用全新的GPT-4大型语言模型。公司的数据显示,在微软将的人工智能聊天技术整合到搜索引擎之后的一个月内,必应的页面访问量增长了15.8%。应用研究公司Data.ai的数据则进一步显示,在微软使用了的技术后,必应搜索引擎在全球的应用下载量增长了8倍,同期表现优于谷歌。
使人机交互更为高效自然。2月20日,微软自治系统和机器人研究小组发表了一篇名为《机器人:设计原则和模型能力》的论文,公布了将的功能扩展到机器人的研究成果。文章中指出,传统的机器人运转始于工程师或技术用户,他们需要将任务的要求转换为系统代码。在机器人运转的过程中,工程师需要不断编写新的代码和规范来纠正机器人的行为。这个过程有着缓慢(用户需要自行编写低级代码)、昂贵(只有具备专业知识的高技能用户才能完成)且低效(需要多次交互才能使机器人正常工作)的弊端。
而则是解锁了一种全新的机器人范式,并允许潜在的非技术用户身处循环之中,在监控机器人性能的同时向大型语言模型(LLM)提供高级反馈。通过遵循研究者的设计原则, 可以为机器人场景生成代码。在不进行任何调整的情况下,非技术用户就可以利用大型语言模型的知识来控制各类任务的不同机器人外形。例如,研究人员曾要求 编写一个算法,让无人机在不碰撞障碍物的情况下到达目标地点。 仅使用自然语言反馈就完成了任务,为算法编码了大部分关键构建块并进行本地化代码改进。
与算力基础设施
一方面,的发展离不开超算基础设施的高算力,另一方面,一批批新的生成式AI的快速研发面世将反过来推动算力基础设施的建设。
近年来,AI训练所使用的算力呈指数级增长。根据的开发公司官网发布的研究报告《人工智能和计算》(Dario 和Danny ),在算力使用方面,训练人工智能系统大致可以分为两个不同的时代:第一个时代,从1959年到2012年,AI训练所使用的算力大概每两年会出现倍增(与摩尔定律大致相当)。第二个时代(现代),从2012年到现在,AI训练所使用的算力平均每3-4个月就会出现倍增,2012-2018年的6年间所使用的计算量更是出现了30万倍的增长。随着的爆火以及谷歌、百度等科技公司陆续推出对标产品Bard和文心一言,可以预见,未来的算力需求将会继续大幅提升。
助推算力基础设施的建设。根据工信部信息通信发展司数据,截至2021年年底,我国在用数据中心机架规模达520万架,五年年均增速超过30%,2022年预计将进一步提升至670万架。在算力需求飞速上升的背景下,叠加等产品对大数据、大模型的高要求,作为算力的物理承载以及数字化发展的关键基础设施,数据中心将迎来更广阔的发展空间。
中兴通讯发布服务高算力场景的新型服务器,满足算力提升需求。1月12日,中兴通讯正式推出的五款G5系列服务器新品,具备高密度算力、异构算力、稳定可靠等特性。其中R6500 G5 GPU服务器最大支持20个单宽半长GPU加速卡,双路最大支持120 核,AI性能提升10倍。3月16日,中兴通讯宣布其服务器将支持百度“文心一言”,为生成式AI产品提供更加强劲的算力支撑。4月份的年报解读交流会上,中兴表示年底有望推出支持的AI服务器以及高性能交换机。
赋能数字经济:产业数字化
产业数字化指的是通过将数字技术与传统行业相结合,优化传统行业的生产关系,提高传统行业的生产效率,其规模是数字技术给传统行业带来的产出增加和效率提升的部分。近10年来,依托大数据、云计算、人工智能等数字技术,产业数字化蓬勃发展,形成工业互联网、智能制造、车联网、平台经济等多个行业及相关产业链,极大地拉动了数字经济的发展。根据中国信通院的统计,2021年,产业数字化规模达到37.18万亿元,同比名义增长17.2%,占数字经济比重的81.7%,GDP比重32.5%。
作为革命性的人工智能技术,其出现将给产业数字化带来较大的增长空间。作为大语言模型,首先将对目前使用自然语言处理技术的场景造成冲击,如聊天机器人、语音助手等,也会给一些垂类场景如智能客服、智慧家居、智能教育等带来变革。通过接入的服务,这些应用的质量将得到显著提升,带来进一步的增长空间。其次,的出现也将会推动AIGC时代的到来,带动各领域AI模型的优化,文字、图像、音乐等领域的创作模式或均迎来重大变革。
智能交互:用户体验全面升级
聊天机器人、语音助手等产品迎来革命性变化。是目前最符合通用人工智能概念的语言模型,可以满足用户的多种需求,后续与语音识别相结合后,也会对现有的语音助手带来革命性的变化。不同于Siri、小度、小爱同学等现有的产品,前文提到了使用的是方式进行训练,而非传统的预训练-微调模式,从而极大地拓展了用户可用的命令范围,产品的用户体验也会发生质的变化。
赋能智能客服,优化服务质量。智能客服是指利用自然语言处理技术、知识图谱技术、以文字或语音等形式协助或代替人工进行客户服务的行业。相比传统的客服,智能客服的介入渠道更丰富,响应效率高。根据头豹研究院发布的《2021年中国智能客服行业洞察》,中国智能客服市场规模以软件为主,2020年市场规模达到30.1亿元,同比增长88.1%,扩张十分迅速,预计2025年中国智能客服市场规模将达到102.5亿元。如今,的诞生显然将进一步推动智能客服行业的发展,通过对在垂直行业进行有针对性的人工反馈训练,可以实现模型在各个行业的应用,有效提升目前智能客服的反馈质量和用户满意度,使得市场进一步扩大。
赋能智慧家居,提高产品性能。智慧家居是产业数字化中一个重要的toC场景,拥有较大的市场潜力。根据头豹研究院发布的《2021年中国智能家居行业概览》,2020年,中国智能家居市场规模达到3558.2亿,主要以智能家电为主,预计2025年市场规模将达到4801.2亿元。目前,国内多家互联网厂商将家居作为自身生态的重要组成部分,例如百度、小米、华为等,都在智慧家居的领域进行了布局。的应用可以有效提升语音控制准确度、增加人物多样性,改善与用户的交互性能。
创作:AIGC时代来临
强大的文本生成能力将极大地改变创作市场的格局,推动AIGC时代的到来。过去几年间,随着移动互联网的普及以及各类平台应用的兴起,内容创作的模式已经由专业生产内容(PGC)转向了用户生产内容(UGC)。上线后,很多用户对其创作功能进行了测试,虽然相较人类的创作水平还有一定差距,但其已经能力已经足够为创作者提供整体的思路以及框架,在用户合适使用进行引导的情况下,还能对原有生成内容加以改进。可以预见的是,未来的内容创作模式将会逐步向AIGC切换。
对于内容创作的本质帮助在于提高内容生产效率、拓宽创作者的思路、提升创作质量等。以网络小说创作为例,可以极大地缩短创作者撰写一些相对次要文段上的时间,专注于关键内容的创作,并很有可能为创作者扩展创作思路,提升作品质量。同时,在一些资讯推送类的应用场景,如热点事件推送,每日新闻推送等,对于文本的文学水平要求较低,但对于时效性、推送频率、内容量有较高的要求,毫无疑问,AIGC的模式可以有效节约人力成本,提高内容产出效率。
语言大模型的出现也将加速推动图像、语音等领域模型算法的进步。图像领域,受益于扩散模型( model)的发展,目前文本生成图像已经展现出较强的性能。例如开发的DALL-E,以及近日关注度较高的,已经可以生成媲美人类水平的作品。音乐领域,昆仑万维旗下的StarX Lab音乐实验室已经发布数首完全由AI作曲生产的AIGC歌曲。我们认为,在未来,随着算力的增强以及算力成本的下降,AIGC的创作模式将越来越普及,演化为创作的一般模式。这一生产模式的切换将有力地提升生产效率,进一步扩大产业数字化的规模。
教育:带来教育模式变革
多家国外公司推出接入的智能助教产品。近日,可汗学院宣布推出人工智能助手“”,并由GPT-4提供技术支持。既可以作为学生的虚拟教师,也可以作为教师的虚拟助教,与学生进行互动对话,提供个性化激励,同时提升了学生的学习体验和教师的工作效率。多个邻国也于上个月推出了以GPT-4为核心技术的“ Max”,给用户带来个性化定制的交互学习体验,可以对学生的回答进行分析并提出改进建议,并且可以与学生进行角色扮演对话,以满足学生的联系需求。
可以提升学习效率、解决教育资源不充足的问题。相比于之前的大语言模型,更加接近通用人工智能(AGI, )的概念。之前以BERT为主导的大语言模型的技术路线是使用少量数据在特定任务上进行微调,这样就导致其可扩展性较差。而使用了的训练模式,因此其可以根据使用者的要求进行非常灵活的回答,泛化以及学习能力很强。从与的对话中可以看到,具有较强的个性化能力。基于此特性,在教育场景中将可以实现“因材施教”,根据学生的需求以及个人特点给出相应的反馈。这样的模式一方面满足了学生的个性化需求,提升了学生的学习效率,另一方面可以有效地解决教育资源短缺以及不平衡的问题。
国内智慧教育领域也将迎来增长机会。国内的一些公司也有若干将AI与教育进行结合的尝试。例如科大讯飞推出的学习终端、学习系统等产品,结合了自然语言处理、深度推荐、知识图谱、大数据分析等技术,可以为学生提供口语训练、写作训练等人机交互功能,或是根据学生的答题情况进行分析,个性化推荐练习题等。可以预见的是,的引入将会进一步丰富相关产品的使用场景,抬升产品的价值,为企业带来增长空间,进一步扩大产业数字化的规模。
及生成式AI相关政策
外国态度:禁用还是放行?
意大利成为第一个限制的国家,但此后态度有所缓和。3月底,意大利个人数据保护局宣布,从即日起封禁,并限制的开发公司处理意大利用户信息,同时对其隐私安全问题开展调查。然而,4月2日,意大利副总理马泰奥·萨尔维尼在社交平台上公开发文,批评意大利数据保护局暂时禁止的决定太“过度”了,“几乎所有在线服务都无法避免会涉及隐私问题”。在他看来,禁用可能会损害国家的商业发展和科技创新,希望能快速找到解决方案,尽快恢复在意大利的使用。4月12日,意大利数据保护局发布了一个清单,作出一定让步,称只要在4月30日前满足清单上的要求,就能恢复在意大利的正常运行。清单中的要求包括公开处理数据的方法逻辑,以及确保作为数据主体的用户和非用户应享有的权利等等。
欧洲立法机构将对实施监管。在意大利宣布禁用后,欧洲数据保护委员会(EDPB)于4月份表示已设立关于的工作组,迈出了共同制定人工智能隐私政策的第一步。而在欧洲议会准备提交的《人工智能法案》中,包含了要求AI产品(例如)明确公布大模型训练时是否使用了受版权保护的数据,意在保障版权所有人索要收入的权利。议员们还提出,等开发者需要为程序被滥用承担责任,而不是由具体的产品使用者承担。《法案》中采取了一种基于风险程度对AI系统进行分类管理的监管思路,有议员提出应该仅将可能危害健康、安全和基本权利的AI列为高风险,若软件服务商认为自己的系统不构成高风险,可以向所在国或欧盟的人工智能办公室提出申请。
美国已就相关的问责措施公开征求意见。由于民众愈发担心等AI技术可能会被用于歧视或传播有害信息,美国政府已经开始研究是否需要对其进行限制。作为对人工智能领域进行潜在监管的第一步,美国商务部4月11日就相关的问责措施正式公开征求意见,包括具有潜在风险的新型AI模型在发布前是否应该进行核准认证程序。
中国:支持AI创新,对生成式AI提供者加强监管
4月11日,国家互联网信息办公室发布了《生成式人工智能服务管理办法(征求意见稿)》,旨在“促进生成式人工智能技术健康发展和规范应用”。《办法》中提到国家支持人工智能算法、框架等基础技术的自主创新、推广应用、国际合作,并对生成式AI提出了监管要求。《办法》中主要提出了以下几点要求:1. 提供生成式人工智能产品或服务应当遵守法律法规的要求,其内容应当体现社会主义核心价值,防止出现民族、性别、年龄、职业等歧视,且需要尊重知识产权及商业道德,不得利用算法、数据、平台等优势实施不公平竞争。2.生成式人工智能产品的提供者,承担该产品生成内容生产者的责任,并应当对其产品的预训练数据、优化训练数据来源的合法性负责。3. 利用生成式人工智能产品向公众提供服务前,应当向国家网信部门申报安全评估,并履行算法备案和变更、注销备案手续。4. 提供者在提供服务过程中,对用户的输入信息和使用记录承担保护义务。
各地对生成式AI保持相对开放的态度。2月13日,北京市经济和信息化局发布了《2022年北京人工智能产业发展白皮书》,提出北京将支持头部企业打造对标的大模型,着力构建开源框架和通用大模型的应用生态;加强人工智能算力基础设施布局,加速人工智能基础数据供给。香港特区政府创新科技及工业局局长孙东则表示,特区政府还没有计划将作为正式的应用程式在政府内部使用,但会对生成式人工智能的发展保持非常开放的态度,密切留意并做出适当的回应。
风险因素
贸易摩擦对信息通讯产业链的冲击;国产替代进度不及预期;地缘政治扰动。
注:本文节选自中信证券研究部已于2023年4月17日发布的《债市启明系列—数字经济图谱(三):如何赋能数字经济?》,证券分析师:中信证券首席经济学家明明执业证书编号: S01
首席资管与利率债分析师:章立聪执业证书编号: S02;周成华执业证书编号: S01;彭阳执业证书编号: S01
首席信用债分析师:李晗执业证书编号: S02;徐烨烽执业证书编号: S02;丘远航执业证书编号: S01
大类资产首席分析师:余经纬执业证书编号: S05;赵云鹏执业证书编号: S02;秦楚媛执业证书编号: S01
粉丝特惠:好股票APP五个热门产品任选一款,体验五天!欢迎下载注册体验!