有需求,便会有AI的用武之地,好未来最想要优化的问题便是落地GPT应用的内驱条件:
1、提高客服响应的实时性,让用户能了解最真实有用的信息
2、验证大模型生产环境的可应用性、跟进新技术
这是精准的定向需求,目标明确,那就开干。但利用GPT去融合进自己的业务应用,显然不能一蹴而就,迭代之路必定挑战重重。那就优先推出一版问答客服,起码定性问题要做起来!
问答客服v_1.0
这是基于企业专有知识库的客服系统,什么意思,企业多年沉淀客服回答的一些问题汇总分类,这些特定领域的数据喂给GPT这个大模型,让其学习这些问题如何回答。那么就衍生出我们都在关心的一个问题:
01
如何让大模型学会特定领域知识
学习方式呢,我们分为两大类,这也是机器学习常用的方法
1、In- (ICL)叫任务解释
2、Fine- 微调
ICL是一种仅给出几个示例就可以让语言模型学习到相关任务的方法
举一个任务示例,只在输入中加入几个示例就能让模型进行学习,如下图中用ICL做情感分析任务
首先,ICL需要一些示例来形成一个演示上下文。这些示例通常是用自然语言模板编写的。然后ICL将查询的问题(即你需要预测标签的input)和一个上下文演示(一些相关的cases)连接在一起,形成带有提示的输入,并将其输入到语言模型中进行预测。
那么对于本文案例应该要考虑三个问题:第一语料要如何组织,第二如何匹配到和用户问题相关的语料,第三则是官方token的限制
02
知识库的搭建
这是原始语料
对应结构化的语料
利用接口API化喂给GPT数据,拆分成若干段去训练,最终我们来看下完整的一个流程
这里面有几个关键节点,第一是向量转化,第二是文本相似度与计算的匹配度,第三则是关键字兜底
这三层才算是起来一个框架,走完一个基本的流程。V1.0官方称之为问答客服,还不敢称之为“智能客服” 那么数据表现如何,一起看下
从上面我们可以看的出来有些东西是一本正经的胡说八道,比如这个电子邮件,其实是并不是真实存在的,还有就是直接回避,不回答问题。包括相关课程也是自己杜撰出来的。
所以综合来看,1.0勉强算是个入门款,那么接下来就是迭代更新了,官方称之为“智能客服”,有多智能呢,我们一起来看迭代进化历程
智能客服v_2.0
从1.0的数据来看,需要针对三大缺陷来针对性升级
更多的场景覆盖,无非是拿更多的数据去喂,去纠正,去微调。动态信息怎么办呢,那就做到实时更新,但是怎么做到不要给业务增加过多的维护成本呢,官方给出下面两套方案
我们看到方案二中用户的自然语言向API结构化数据的转换采用了的思想,Auto大家也知道,风靡一时,和叫板的AI工具。
对于Auto的思想借鉴,演讲者孙凤伟是这么总结的
是一个程序,它利用大模型对自然语言的理解能力,基于用户下达的需求,解析用户的意图并利用 程序里内置的一些基本能力(如联网搜索、文件的读写、逻辑运算、内存、其他小模型的能力)自主的制定执行计划和多轮迭代,最终来实现用户的需求
Auto的是如何组织的
看不懂这些?没关系,看一个完整的流程图,你就知道了
这套流程就是对应上面的那个的组织思想,最后我们看下方案的总设计以及一个总的流程。
现在升级到智能客服2.0了,数据的表现有没有比以前好呢
基本上都是保持在80%以上,甚至是90%
总结与思考
这是孙凤伟老师给我们的三大启示,要想AI与业务融合落地,这三个缺一不可,这也就是说未来比较火的可能就是提示词工程师
还记得刚才说到缺陷之一,即不可控,但是我想借用老师的一句话:不可控,但是请选择相信,相信GPT的能力,相信数据,相信功能
上次说参加了一个AI线下大会,里面有很多大佬讲的AI干货,走总结成了ppt,现在放到下面这个公众号了,有需要点击菜单“大模型PPT”