“在ChatGPT出现之前,我们就已经认识到大模型是个大趋势,决定把公司已有产品的底层核心引擎全部转移到大模型上,” 北京中关村科金技术有限公司技术副总裁张杰如是说。
这或许是很多人无法理解的,毕竟彼时大模型的概念还没在国内流行开来。
而让中关村科金下定决心全面拥抱大模型的原因在于,大模型并非新事物,早在2017年就有了Transformer的架构,次年谷歌就基于该架构推出了BERT大模型,并在产业界产生了不小反响。
反观中关村科金的业务和产品,我们不难发现,区别于其他To B公司,自2014年成立以来,中关村科金就选择以对话式AI为核心技术,专注于企业服务赛道提供对话场景服务,其不仅注重底层技术的自研,还强调下场做应用。
自带AI基因,或许也是中关村科金较早拥抱大模型的原因之一。
大模型方面,中关村科金也在沿着之前的路径走:一是自研领域大模型,二是做上层应用。
为什么选择领域大模型而不是通用大模型?
张杰告诉AI科技评论,从长远来看,通用大模型确实能给行业带来巨大的价值,但从目前来看,通用大模型在处理专业问题方面还不是很聪明,不能满足企业对专业性、合规性、规模化的需求。相反,领域大模型不仅不需要依赖大算力,还能切实解决领域内某几类细分场景的问题。
至于备受业界关注的模型参数规模问题,张杰表示,主要结合实际场景的应用情况,比如财富管理领域的大模型只需要50亿参数规模就能很好地用于营销、客服等场景,那就没必要做成1000亿参数,避免用大炮打蚊子,节省算力消耗的资源。
在进行领域模型探索的同时,中关村科金也没有忽略应用层。AI科技评论了解到,目前中关村科金已有的产品如智能外呼、智能客服、智能质检、智能陪练等产品通过自研的对话引擎已全面拥抱大模型。此外,中关村科金还结合企业的痛点问题和客户共创了多个有场景代表性的试点项目,例如:推出了虚拟员工助手,帮助企业打造“超级员工”,在营销文案生成、客服问答、坐席助手等场景,助力企业营销服价值提升,已经在业内有了很好的落地。
当然张杰也坦言,通用大模型已经火到了一定程度,目前C端应用火爆,“但在B端企业服务赛道,很少有人意识到大模型未来会对企业的生产关系带来很大影响。
中关村科金为什么选择从金融行业尝试大模型应用?
金融行业在数字化转型项目方面表现出了较高的接受度,相较于其他行业,金融行业对于数字化转型的需求更加明确,同时也能更明显地看到智能化手段带来的商业价值。尤其是头部金融企业,对于服务品质和响应速度等方面的要求非常高,因此需要与合作伙伴迅速合作,共同创造成功。而对于腰部企业来说,一旦看到了成功案例,复制这些经验就会变得更加迅速。
是不是很难?毕竟对数据方面的要求比较高?
张杰:在数据方面,我们可以将要求细分为不同的类型。一方面是容易获取的公共领域数据,另一方面是难以获取的私有领域数据;一方面是成本较低的隐性标注数据,另一方面是成本较高的显性标注数据。在面向企业的场景中,训练一个领域模型需要一些高质量且规模较小的数据。然而,数据标注的成本较高,不是每家人工智能公司都有能力自行建立团队来完成这项工作。这也是我们能够在大规模模型应用方面具有竞争优势的一个门槛。
通过将这些高质量的领域常识数据注入到大规模模型中进行训练,我们可以使模型具备更多的领域知识,学习领域的语言特色,并提升对领域数据的理解和生成能力。除了将通用的大规模模型转变为领域专家,我们还通过领域提示工程组件使其能够有效处理特定场景下的任务,并具备相应的场景技能。
客户愿意把自己的数据拿出来训练吗?
张杰:银行的数据训练需要我们亲自去银行进行。然而,有一个误解需要澄清。如果我们想要训练大型模型,仅仅使用企业机构自身的数据是不够的,我们还需要公共领域的数据,例如金融行业的研究报告、财经新闻、上市公司的财务报告以及专家的解读。如何筛选这些数据,如何让模型既学习到领域知识又不忘记通用常识,以及如何将领域知识与具体场景的问题联系起来,这些都需要我们进行探索和积累。目前,高质量的数据一部分是经过精心筛选的公共领域数据,另一部分是小规模但高质量的私有领域数据。
此外,许多公司还没有完全意识到,不仅原始数据有价值,总结出来的抽象知识也非常宝贵。就像过去100年太阳系8大行星在天空中的轨迹数据一样,这些原始数据的价值可能不及万有引力定律这样的抽象知识。
之后会做哪些应用?会主动选择一些场景突破吗?
张杰:关键在于抓住机遇,虽然技术往往是通用的,但具体应用场景需要根据机遇来确定。我们一直在积极寻找与各行各业合作的机会,共同创造价值。目前,我们已经在金融、公安、医保和健康领域找到了一些实际应用场景,未来我们将继续深入挖掘这些领域中复杂推理能力的大型模型,使模型不仅具备专业的事实判断能力,还能自主进行过程判断,成为跨领域的虚拟办公助手。
大模型还是有一定泡沫存在的?
在大潮之下,泡沫是不可避免的存在。然而,从长远来看,泡沫确实能够为行业带来巨大的增值和机遇。特别是大模型的火爆出圈,不仅让更多人认识到人工智能的价值,还减少了向客户进行科普的成本,加速了人工智能商业化的进程。
在人工智能行业中,大模型的兴起引发了一股热潮。大模型是指参数规模庞大、计算能力强大的人工智能模型,如GPT-3、BERT等。这些模型具有强大的学习和推理能力,能够处理更加复杂的任务和问题。因此,它们在自然语言处理、图像识别、智能推荐等领域展现出了巨大的潜力。
大模型的火爆出圈,不仅是因为其强大的性能,还因为它们能够为行业带来巨大的增值和机遇。首先,大模型的出现让更多人认识到人工智能的价值。以前,人工智能被认为是一种高深的技术,只有少数专家才能理解和应用。而现在,通过大模型的普及,人们可以亲身体验到人工智能的强大能力,从而更加认识到它在各个领域的应用潜力。
其次,大模型的普及减少了向客户进行科普的成本。在过去,人工智能公司需要花费大量的时间和资源向客户解释人工智能的原理和应用。然而,通过大模型的普及,客户可以通过简单的操作和交互,就能够感受到人工智能的价值和效果。这不仅节省了公司的成本,还提高了客户的满意度和信任度。
最后,大模型的火爆出圈加速了人工智能商业化的进程。由于大模型的强大性能和广泛应用,越来越多的企业开始将人工智能技术应用到自己的业务中。这不仅推动了人工智能技术的发展,还为企业带来了巨大的商业机会。例如,在智能推荐领域,大模型的应用可以提高用户的个性化推荐效果,从而增加企业的销售额和用户粘性。
总之,尽管大潮之下泡沫肯定是有的,但从长远来看,大模型的火爆出圈确实能给人工智能行业带来巨大的增值和机遇。它不仅让更多人认识到人工智能的价值,减少了向客户做科普的成本,还加速了人工智能商业化的进程。因此,我们应该看到大模型的积极影响,并在其基础上进一步推动人工智能的发展和应用。
中关村科金在大模型方面的的愿景是什么?
协助企业培养出“超级员工”的方法正在兴起。我们将使用一个智商较高、理解能力强、记忆力出众的“文科生”作为基础,然后注入企业的领域知识,使其成为一个具备领域知识的“普通员工”。通过与人类专家的密切合作和专业的产品设计,我们不断进行闭环反馈,使其能够不断学习和提升,逐步成为“超级员工”。这些“超级员工”将有助于企业改造内部的生产关系。
过去,企业的管理结构通常是树状的,从董事会到各个部门,呈现出金字塔形状。然而,大模型的出现给我们带来了新的启示,它可以独立承担一些任务,不仅仅是替代体力劳动,还可以替代一些简单的脑力劳动。
未来,企业的组织结构将呈现纺锤形,人类经营者负责重大决策和战略,而中间层将由人工智能来真正承担工作。然而,我们也意识到,并非所有任务都可以完全交给人工智能,少数业务专家仍然需要指导机器或与机器协同工作。因此,未来的组织架构将是“人-机-人”的结构。
我们相信,未来将是人机协同的时代。随着大模型重构企业组织架构和生产关系,短期内一些不产生价值的中间职能可能会被机器取代。然而,从长远来看,涉及价值判断、规则制定以及与人性和心理相关的工作,大模型无法取代。
323AI导航网发布