这两天,新上线的实在是太火了!首富马斯克一马当先,带着大家玩得不亦乐乎,看起来,人工智能的奇点就要到来了!没玩过的朋友,我也不多作介绍了,自行搜索即可。
范围界定
对话式AI产品
赛道定位:人工智能产业落地的先行环节与价值凸显赛道
产品定位:替代与辅助人工对话的“共生”,达到最优人机协作
发展历程:对话机器人在深度学习技术突破后实现产品规模化落地,应用场景逐渐丰富,横向 拓宽应用领域(客服-营销-泛交互),辅助赋能纵向挖掘价值空间(洞察与决策)
资本走向:对话式AI市场的融资事件数量自2014年起显著上升,跨过2018年热潮后节奏放缓, 优质厂商逐步实现自我造血,而客服与金融分别为对话式AI厂商的核心业务与高频行业 市场分析:2021年,对话式AI的市场规模为45亿元,带动规模126亿元。
对话式AI的产品定位
替代与辅助的“共生”,最优人机协作;对话式AI产品可替代人类对话完成大量重复性、规则性对话任务,优化重构对话服务的工作流与职能重点,还可为对话服 务提供智能调度、坐席助手、对话洞察等辅助功能,与人工坐席并肩作战,构建辅助培训、运营管理、指导洞察的良性循 环。当下,对话式AI产品的应用意图并非通过AI产品去完全替代人类,而是以用户为中心,以实现对话服务质效提升为目 的,从替代与辅助双角度出发,达成对话工作流人机协作的最优赋能。
与其前一代相比,的效果太惊艳了!大家体会最深的一点,是机器人说的“像人话”了。这个像人话,有两层意思,首先是对一些知识性内容的回答准确率大大提升,这个例子就太多了,咱们随便贴两条:
自然语言处理的大模型,一直有个问题:如果完全无监督训练,无法甄别语料的真假和质量;这次从回答质量上有质变,应该是对某些高质量内容做了加权,采用了类似有监督训练的方法。从结果上来看,是相当成功的。
最让我感到惊讶的,是这次在伦理方面给出了诸多令人称赞的限制,不用说,这肯定也得有点监督。除了大家熟悉的“未来预测类问题不作答”
对话式AI的拓展提升
除了内容,回答的条理性和语言流畅度也特别好。基本上会把各方面的信息综合成一二三点的模板,颇有点领导讲话的派头。因此,我认为在语言生成的结构上,也应该是特意选择了一些高质量的严肃帖子,同样采用某种程度的有监督学习。这回采用了强化学习的方案,而强化的具体做法,就是找几个人盯着结果标注,这本质上跟有监督意思也差不多。
是不是能够如很多人所期盼的那样,成为搜索引擎的杀手呢?
熟悉搜索的朋友应该了解,搜索查询分为两类:信息型搜索( )和浏览型搜索( ),咱们分别来看看。
信息型搜索,就是要找某个具体的信息或知识,要求当然就是准确、清晰。从清晰性来说,给的这种结构性呈现,比传统搜索引擎强多了!可是从准确性来说,坦率地说,目前还差点儿,经常会有些似是而非回答。
对于搜索引擎来说,肯定算是一个重要对手了。只不过,由于用单条回答替代了信息罗列,对准确性的挑战相当大,目前还是任重道远;另外,现有的技术栈看起来还不能支持准实时的信息索引,这对其实用性限制非常大。
客服与金融分别为对话式AI厂商的核心业务与高频行业
对309起融资事件去重统计后,共有103家对话式AI企业在2012年至2022年2月期间获投。本篇报告以103家对话式AI企 业为分母样本,从业务与行业两个维度统计其领域分布情况,结果如下:从业务分布来看,客服与营销为对话式AI厂商的 核心业务,占比分别达到84.5%与38.8%。从行业分布来看,金融、医疗、政务、零售和教育为对话式AI企业的热门行业 选择,其中金融以54.4%的比例分布位列榜首。
从“甲方”企业角度来看,人工服务带来成本效率方面的痛点由来已久,而预期应用对话式AI产品后可切实解决人工服务 相应痛点,降本增效明显,另外对话式AI产品在客服营销部门的IT智能化升级实施业务难度较小且能带来更多业务增长空 间;从“乙方”对话式AI厂商角度来看,在深度学习突破带来AI技术可进一步规模化落地的大背景下,对话式AI产品应用 场景相对标准化,且在早期模板机器人的市场教育下,客户对相应产品的接受度高,对话式AI产品可实现较好的规模化落 地与应用价值体现。因此,在供需两侧的合力推动下,对话式AI产品已成为人工智能领域中较为早期、实现规模化落地的 AI产品。
生成式AI应用
随着人们围绕着“生成式AI”( AI)的讨论和炒作不断增加,风险投资人们正在忙着投资这些人工智能初创企业,以填补失败的加密货币和区块链企业留下的空白。
最近一段时间来,能够在短短几秒钟内编写脚本和创造艺术的复杂计算机程序获得了飞跃式的发展,这类人工智能工具让大量投资者对其发生了兴趣,这些项目获得的投资金额也在飙升,在近年来估值暴跌和裁员主导的创业环境中创造了一个罕见的亮点。
是一家总部位于美国旧金山的公司,微软是其最大的资助者,上周该公司向公众发布了其GPT-3.5软件的最新版本,它可以通过文本与用户交谈,并不断回答后续的问题,甚至可以承认错误并拒绝不适当的请求。
在短短五天内,的用户数突破了100万人,并得到了亿万富翁埃隆·马斯克(Elon Musk)的赞扬,他是的联合创始人,但是在2018年离开了董事会。马斯克在上表示:“好的可怕,我们离危险且强大的人工智能不远了。
AI技术底座由智能语音、自然语言理解与知识工程核心支撑。在工作流程中,智能语音技术分为语音识别 (ASR: )与语音合成(TTS:Text-To-)两类,实现对话内容从语音到文本、 从文本到语音的相互转换;自然语言处理可分为自然语言理解(NLP: )与自然语言生成 (NLG: ),其关键是要让机器人“理解”人类语言中的意图并基于知识库“生成”对应 的自然语言,完成人机对话交互;知识库为对话式AI产品的大脑,由知识工程支撑建设。现知识工程以深度学习FAQ为核 心应用,另包括表格知识库、知识图谱和文档阅读理解等技术。
语音识别准确率至关重要,决定后续自然语言理解效果
在对话机器人产品中,智能语音技术主要应用于语音机器人与视频机器人/数字人产品的对话交互,由语音识别(ASR) 与语音合成(TTS)两部分组成。从工作流程来看,用户真人的语音会先通过ASR(语音识别)技术将其转化为文本,再 接入NLU(自然语言理解)进一步理解用户意图。因此,智能语音技术中的语音识别准确率至关重要,转换的正确与否直 接决定了后续自然语言处理的效果。现阶段,语音识别的效果与成熟度已达到了相对先进的水平,对话式AI厂商正从 VAD静默检测、ASR声学模型与ASR语言模型三部分入手,对应突破各部分的技术难点,以进一步提升语音识别的准确率。
知识工程技术
提升知识库运营建设能力,基于投入产出评估新技术开发,知识工程已从早期单一FAQ技术发展丰富到深度学习FAQ、表格知识库、知识图谱、文档阅读理解等多技术阶段。从客户 端体验来看,对话式AI厂商将持续追求知识工程技术的丰富升级,根据客户的业务及资料特点为其匹配合适的知识工程技 术,将知识库的建设质效最大化;从厂商自身经营来看,厂商需基于投入产出判断是否开发新技术。以知识图谱为例,知 识图谱可支撑多知识点的综合判断,提升对话式AI产品在复杂问题下的答案准确度,但知识图谱同样存在技术门槛高、开 发投入大等特点,厂商需根据所需投入与业务落地价值,去评估是否投入开发,并选择判断合适的行业切入点。
业务模式分布
业务收费以软件产品为主,规模占比将稳步上升
对话式AI产品按照业务模式可分为公有云产品与私有化部署。公有云产品以软件产品为主,私有化部署包括软件产品、硬 件产品及开发运维服务。从整体市场规模来看,对话式AI产品的市场产值主要集中在软件产品部分,2021年软件产值为 32亿元,占比为71.6%。未来互联网等以软件服务为主的行业应用落地范围加大,将进一步拉高软件服务部分占比,预计 2026年软件产值将达到76亿元,占比升至73.4%。
未来新一任主战场
未来,营销与对话洞察可成为对话式AI厂商重点发力方向
客服领域的场景相对标准化,且早期市场教育成熟,客户接受程度高,因此对话式AI厂商多从客服领域切入,提供以对话 式AI产品为核心的智能客服解决方案。如今客服领域的参与厂商云集,且产品逐步趋于同质化,传统客服领域的智能化升 级已成为一片红海。未来,以厂商的AI技术成熟度与客户的付费意愿倾向为判断基础,半标场景的营销与决策赋能的对话 洞察可成为对话式AI厂商的重点发力方向。值得注意的是,营销与对话洞察领域并非是相互割裂,而是相辅相成,两者将 共同从服务营销一体化、助力业务增长的角度,塑造厂商的差异化产品力,实现从红海转向蓝海的价值突围。
数字人带来的产品拓展
“服务”产业的形式拓展,“泛娱乐”场景的产品试水
2022年1月,国务院印发“十四五”数字经济发展规划的通知,再度强调了虚拟数字技术的创新发展,深化人工智能、虚 拟现实、8K高清视频等技术的融合,拓展社交、购物、娱乐、展览等领域的应用,促进生活消费品质升级。在服务产业, 数字人产品可在替代人工,或实现由文本、语音机器人到数字人的产品升级,让用户在对话交互中获得更流畅、拟人、优 质的服务体验;在泛娱乐产业,数字人产品可从形象、声音、人设等角度做自定义定制,打造成为虚拟主播、虚拟偶像、 虚拟博主、虚拟主持人、虚拟记者等虚拟人物,显著提升内容生产效率与人物形象稳定性,实现物理与虚拟进一步的融合 交汇。