01
是什么?
全称Chat Pre- ,是美国团队(一家做人工智能的公司)在2022年11月30日发布的一款聊天式的软件,一经发布就被誉为是“史上最强大的人工智能”,这家公司到目前为止已经发布了(人工智能对话)、DALL·E2(人工智能修图)、(人工智能语音)三款产品。
02
发展历程
从2018年的GPT开始,经过GPT-2、GPT-3,到现在的,一系列在自然语言处理领域取得突破性成果的模型。
图为 与GPT 1-3的技术对比
03
技术原理
是一个依托于数学模型的算法,这项技术之所以看上去如此强大,本质上,源于三件事:超大的计算量、超大的数据库、比以前更好的算法和模型。总体来说,生成结果的前提,是拥有非常庞大的数据库来进行大量计算。所以,如果把当成一项技术的话,也许这项技术早在上个世纪就已经存在了,只是语言的表达方式在迭代,数据库在更新,数据量在变大,而是生成式人工智能技术(AIGC)浪潮的一部分。
背后的工作原理可以分为以下几个方面:
01 模型架构
是基于GPT( Pre- )架构构建的,它使用了深度学习中的模型,这是一种基于注意力机制的神经网络模型,其核心是自注意力机制和多头注意力机制,这两种机制都能够对输入的信息进行自适应地编码和解码,从而实现自然语言处理的任务。
02 数据集
使用了海量的语言数据集进行预训练,例如维基百科、新闻、小说、社交媒体等。这些数据集中包含了大量的文本信息,覆盖了多种语言和语境,从而使学习到更加广泛的语言知识和语言规律。
03 预训练
采用了预训练的方式进行训练,即在海量的语料库上进行无监督的学习,从而让模型能够自动地提取和学习到文本中的语言特征和规律。
04 微调
预训练完成后,可以进行微调以适应不同的应用场景。在特定任务上,通过有监督的学习来训练模型,增加一些特定的训练数据或调整模型参数来提高其性能,从而能够更好地适应该任务的需求。
05 推理
的推理过程包括两个步骤,即编码和解码。在编码阶段,输入的文本被转换成了一组包含输入文本语义信息的向量表示;在解码阶段,通过模型生成一个个单词或短语,最终生成符合需求的完整语句。
04
常见应用场景
当前已覆盖回答问题、撰写文章、文本摘要、生成计算机代码,且嵌入人类反馈强化学习及人工监督微调,具备了理解上下文、连贯性等诸多先进特征,解锁了海量应用场景。
在对话中,会主动记忆先前的对话内容信息(上下文理解),用来辅助假设性的问题的回复,因此其也可以实现连续对话,提升了交互模式下的用户体验。同时,也会屏蔽敏感信息,对于不能回答的内容也给予相应建议。通过算法屏蔽,减少有害和欺骗性的训练输入。
用户可以像与人类对话一样与进行交流,可以为用户提供各种服务,例如处理问题、知识问答、协助写作或创作、编写代码等。不仅可以使用文字进行交互,还可以支持语音和图像等多种输入形式。
应用场景
01 智能客服
02 知识问答
03 自动写作
04 语音交互
05 情感分析
06 搜索引擎
07 编码助手
05
商业前景
(1)+传媒:实现智能新闻写作,提升新闻时效性
(2)+影视:拓宽创作素材,提升产品质量
可以为剧本创作提供新思路,创作者可根据的生成内容再进行筛选和二次加工。从而激发创作者的灵感,开拓创作思路,缩短创作周期。
可以提升影视剪辑、后期制作的水平,实现对影像进行修复和还原,可以有效帮助影视制作团队降低在内容创作上的成本,提高内容创作的效率,在更短的时间内制作出更高质量的影视内容。
(3)+娱乐:加强人机互动,激发用户参与热情
实现趣味性图像或音视频生成,激发用户参与热情。图像视频生成,极大满足用户猎奇需求;语音合成,变声增加互动娱乐性。
(4)+营销:打造虚拟客户,赋能产品销售
虚拟客服为客户提供24小时不间断的产品推荐介绍以及在线服务能力,同时降低了商户的营销成本,促进营销业绩快速增长。
(5)+其他:促进数实共生,助力产业升级
+教育:给教育工作者提供全新的教学工具,学生可以通过自主提问的方式快速查缺补漏,让每个学生得到更个性化、更智能的教育。
+金融:一方面,金融机构可以通过实现金融资讯、产品介绍视频内容的自动化生产,提升效率;另一方面,可以通过重造虚拟理财顾问,让金融服务更有温度。
+医疗:可以快速了解患者的病情并给出较合理的及时反馈,从而舒缓患者的情绪,加速其康复;同时,让医者有更多的时间和精力集中在关键患者的关键治疗环节。
06
带来的巨大影响
带动新一轮发展浪潮,2023年初,微软和谷歌均宣布裁员计划,但均加大在AI行业的投入。
科技巨头积极布局生成式AI
部分公司已有成型产品
当前,国外的优势遥遥领先,但AI的发展需要大量资金、人力等多方面的投入,需要漫长的数据积累,需要庞大的用户数据基础。因此国内的市场的巨头如百度、腾讯等也具有相当大的优势,在人工智能竞赛中,中国企业也将异军突起。
带动产业链上下游协同发展
从上游增加需求来看,包括算力芯片、数据标注、自然语言处理(NLP)等。从下游相关受益应用来看,包括但不限于无代码编程、小说生成、对话类搜索引擎、语音陪伴、语音工作助手、对话虚拟人、人工智能客服、机器翻译、芯片设计等。
随着算法技术和算力技术的不断进步,也会进一步走向更先进功能更强的版本,在越来越多的领域进行应用,为人类生成更多更美好的对话和内容。
下一章创新小组将针对在保险行业的应用进行研究。
组长:陈凡
组员:周都 雷佳琪 王美琳 陆颖婷 孙乙丹 毛聪玲