ai智能的应用有哪些沃丰科技GaussMind｜万亿参数时代，AI大模型在智能客服领域的应用

默认分类2年前 (2023)发布 admin

2,551 0 0

当前,世界人工智能技术进入“第三浪”,正经历突飞猛进的发展。从业界角度,在过去的2021 年如果要选一个年度行业关键词,非 “大模型“莫属。AI大模型依靠巨量的训练数据,大大提高了人工智能的通用性,其强大的能力令人赞叹。

沃丰科技作为人工智能客服领域的领航者,已经在AI大模型方面取得重大进展。沃丰科技紧跟前沿技术脚步,将AI大模型应用到了智能客服领域,在相似问题推荐、情绪识别等领域取得了重要成果。

参数量从1750亿到1.6万亿

AI大模型已经成为了人工智能领域新的高地,只用了一年多的时间,AI大模型疯狂迭代,技术不断突破。参数量级从千亿、万亿,迅速跃迁到10万亿级别。各大科技巨头,争相进入赛道,角逐日渐激烈。

2020年6月,在训练约2000亿个单词后,模型规模达到 1750 亿参数、被业界大咖称为“史上最强大AI模型”的GPT-3一炮而红。写小说、编剧本、敲代码……GPT-3无所不能。2021年1月,谷歌提出了自己的模型,声称参数量提高到1.6万亿。在计算资源相同情况下,训练速度大大提升。随后,华为、阿里等国内厂商也先后推出了自己的大模型。

大模型预训练模型

前沿厂商AI大模型的应用示范

一直以来,前沿技术如何与实际结合,发挥应有的商业和社会价值,都是行业内的重点难点,AI模型亦是如此。如何能让模型更好地适配场景,困扰着诸多的巨头与业内专家。虽然大模型仍处于探索期,但一线厂商借助大模型的优势、资深行业经验,依然给出了精彩的应用示范。

其中,华为云“盘古”推出了药物分子大模型,实现了全流程AI辅助药物设计;智能电力巡检场景用无人机代替人工进行缺陷检测;还有智能居家、智能车载、智能设计等等。

大模型已经可以在能源、医疗、物流、金融等100多个场景实际应用,为企业效率提升做出了重要贡献。但在智能客服领域,大模型的落地并不十分顺利。作为智能客服领域领头羊,沃丰科技一直在思考,是什么制约着大模型的应用?大模型能够为智能客服带来怎样的改变?沃丰科技以切身实践,着力探索大模型在行业内的应用之路。

AI大模型的技术优势明显

在模型结构趋于稳定的情况下不断实现精度突破

ai智能的应用有哪些沃丰科技GaussMind｜万亿参数时代，AI大模型在智能客服领域的应用

优秀的推理能力是模型增大最为突出的优势。沃丰科技在基础AI能力之上,通过对大模型的使用,在语音技术噪声问题、口音问题、铃声问题,自然语言处理的动态场景元素缺失问题、语义深度推理问题、多意图理解问题等方面都有了不同程度的提升。沃丰科技通过模型推理+人工的方式,产出了一批更优质、更具有温度的机器人答案。同时我们也在研究、改进模型,业务与研发齐头并进。

图像和自然语言处理任务随着模型的更迭,准确率持续突破

减少对数据标注的要求

标注数据一直是制约模型效果的难题,人工标注数据费时费力。大模型拥有自监督的学习方法,可以很大程度减轻对标注数据的依赖。尤其是面对小样本数据时,数据量不足的问题就更加突出。以往的小样本效果都不尽人意,我们在尝试大模型后,依靠少量标注数据就可以达到不错的效果,提高效果的同时极大程度地减轻了人工压力。

为下游任务提供预训练方案

AI模型研发成本极高,很难满足市场定制化需求。于是大模型提供了一种“预训练+下游微调”的模式。沃丰科技以大模型为中心,去适应特定领域的业务,极大地提高了模型的泛化能力。

大模型落地的难点

成本过高

有趣的是,在GPT-3的论坛中,有一个非常扎心的标签:“炫富”。

以红极一时,家喻户晓的BERT模型来说,训练一次的成本大概要1.2万美元,GPT-2的成本大概是BERT的3-4倍。而GPT-3的参数量是GPT-2的100倍,训练成本估计在千万美元之上。这个数字,对于很多公司是遥不可及的,更不用说最新的模型参数已经远不是GPT-3的数量级了,所需经费已经成为了天文数字。

同时,大模型的能力并没有强大到让人忽略成本。一些任务量小的场景,一味依赖模型,只会造成资源浪费,如“大炮打蚊子”。如何在控制成本与提升效率、提高客户满意度中权衡,成为了大模型落地智能客服的关键问题。

ai智能的应用有哪些沃丰科技GaussMind｜万亿参数时代，AI大模型在智能客服领域的应用