能写研报、能生成代码、能写作业,还作得了诗……人工智能聊天机器人近日火爆“出圈”,让人惊叹。不少金融机构也利用写企业宣传稿、行业研究报告,或进行投资者教育宣传、推广。
“在金融领域,能够应用在欺诈检测和风险管理、算法交易和投资组合管理、客户服务与支持、信用评分和贷款承销、对金融市场的洞察和预测等方面,有着巨大的想象空间。”行业专家对记者表示。
不过,上述行业专家指出,如何确保AI(人工智能)生成的答案可靠,将是这类AI机器人落地金融领域的最大挑战。此外,对于瞬息万变的金融市场,AI如果无法及时获取最新的信息并迭代模型,将做出落后于当前时点的判断,因此时效性也是类AI机器人落地金融领域的一大阻碍。
持续出圈
为何会火爆出圈?冰鉴科技董事长顾凌云对《国际金融报》记者表示,以先前发布的GPT-3系列模型为基础,拥有千亿级别的参数量和百亿级token,可以生成高质量的文本,支持多种语言,通过创新性地引入人为监督干预和强化学习技术对模型进行调优,使得相比之前的语言模型,能够生成更灵活、更准确、更具上下文连贯性的语句,可以回答各种复杂问题并生成相关的解释。
“传统的NLP(Neuro- )模型,有很明显的时序特征,基本上都会有一个逻辑层存在,会先将用户的提问进行词义分析,转换成某种‘人类的语义表达’,再以此映射到标准问题库,从答案库中找到最适合此问题的答案。而利用打破了时序计算的逻辑,跳过了词义分析,使其更自然地与人类开展对话交流。”萨摩耶云科技集团创始人林建明告诉《国际金融报》记者。
数库科技人工智能科学家指出,在多项任务上都取得了明显的进步,包括对自然语言的理解、数学的推理、程序代码的生成等,并且在语言生成方面效果提升很明显,生成的语言比以往的模型更近似人类(的表达)。
金融壹账通人工智能研究院总工程师徐亮对《国际金融报》记者分析称,首先是模型规模更加庞大,的基线模型使用的是GPT-3.5系列的大规模语言模型,其中原始版本的GPT-3模型的参数量已达1750亿。当参数规模达到一定量级,模型突现能力( )会带来更强的推广能力和稳定性,也表现出一些对“复杂推理”的处理能力,这些都是小量级模型达不到的。直观的表现是,在组织语言方面,较过去的机器人看起来更有条理,能够回答的问题范围也更广。
其次,采用了最新的训练范式。不同于现在业界较为常用的预训练(pre-train)结合精调(fine-tune)来让模型适配下游任务的学习范式,GPT-3及GPT-3.5系列的模型训练从提示学习( )出发,结合了代码训练、指令微调等策略,使得模型不再局限于只做一种类型的任务,而是能够听从人类语言的指令去做更多事情。对于用户来说,就是理解用户意图的能力更强了,与人类的交互也更加自然。
第三,的训练步骤中加入了基于人类反馈的强化学习( with from Human ,RLHF)策略,让标注人员不断对不同回答的满意程度进行排序,建立奖励模型( Model),再利用强化学习建立模型的奖励机制。这套奖励机制可以让模型的回答更接近人类的语气,倾向于给出较长回答,同时增强回复的自然感,使用户体验有极大提升。此外,还较好解决了对话任务中长程记忆、上下文一致性等问题,使得用户对交互的评价有了进一步的提升。
金融领域应用广泛
火爆出圈也引起金融机构的“试水”。不少基金公司借助开展投资者宣教活动,银行则利用进行品牌营销,而券商利用撰写行业研究报告……
在金融领域主要应用在哪些方面?《国际金融报》记者和聊了聊,给出的答案是聊天机器人、风险评估和投资建议这三个方面,后续会在自动化交易、数据分析和智能合约方面进一步应用。
徐亮指出,在金融领域,能够应用的范围非常广泛,包括欺诈检测和风险管理、算法交易和投资组合管理、客户服务与支持、信用评分、贷款承销、对金融市场的洞察和预测等。
“在量化投资中,可以完成一些简单的量化策略,例如构建平均回归模型,输出均线策略。理论上甚至可以利用-learn数据库(是针对编程语言的免费软件机器学习库)建立制作未来利率的预测模型,并利用MSE(均方误差)对其进行评价。”徐亮表示,智能投顾是以人工智能为基础的一项专业的投资咨询服务,这类AI机器人应用以后,能排除人的主观因素,提供更加客观的建议,还可以随着市场和环境的变化而不断演变创新。
林建明认为,金融机构在利用技术逐步赋能场景方面,有着巨大的想象空间。在智能营销、智能客服、风险识别、代码编程等方面都是较好的应用方向。但期望借助来进行量化投资和智能投顾,在方向上不是较好的选择。因为无法取代投资顾问的人际关系和投资经验,也不能替代投资顾问根据客户的独特情况为其提供个性化的投资建议。
顾凌云表示,事实上提供API接口服务,通过接口可以直接调用其服务,并训练自己的模型。举例来说,在银行理财产品推荐模型中嵌入,可能会提高向客户推荐理财产品时的交互体验。类似的大规模预训练语言模型(Large Model,LLM),在金融领域会有用武之地。
徐亮判断,未来可以应用于自然语言处理(NLP)和聊天机器人、预测分析、强化学习、区块链、计算机视觉等新兴的热点领域,并对金融业的发展形态产生巨大影响。
准确性、时效性面临考验
的出圈也引起人们的担忧。数库科技人工智能科学家告诉《国际金融报》记者,目前最大的问题是模型无法保证给出的回答是真实可靠的,因此在金融领域应用时可能需要通过一些其他手段和方法对进行检验,以保证结果的真实性。
林建明表示,不可否认的是,在发展过程中,也面临着虚假信息、数据安全、知识产权合规、伦理等各种各样的风险。但是,这些风险可以通过技术的方式予以解决,比如通过奖励模型过滤风险,通过人类反馈来优化语言模型,让其更加智能的预测人类的行为,从而保证生成结果的真实性和安全性。
徐亮指出,目前,存在事实性错误、实时性差、缺乏稳定和可重复性等不足,通过放出的训练核心步骤可以发现,更像是一个组合了数种新技术模块的基本框架,这个框架自身的每个部分都还有广阔的改进空间,例如在大模型部分引入先验知识,在奖励模型阶段新增更丰富的判断和排序准则,提升模型回答的可信度和可控性等。
金融领域对可靠性及准确性的要求较高,如何确保模型生成的答案可靠,将是该类模型落地金融领域的最大挑战。徐亮表示,“当然,我们可以转换思路,例如让此类模型作为辅助,来让传统的、精准的流程更富人性化;或考虑人机协作,由模型结合专家来确保答案的可靠”。
顾凌云也指出,类似的AI技术目前确实还存在不少风险。比如大规模使用网络公开数据训练模型,可能会使得意外泄漏的个人隐私信息留存在神经网络中,存在隐私风险。模型使用人类的反馈来对模型进行调优,但这些反馈无法代表所有的人,这也给模型带来了统一的有偏好的价值判断,存在一定的道德风险。已经能对很多问题做出精彩回答,但依然可能生成符合人类语言习惯但不符合事实的回答,在使用相关AI模型时,需要有足够的辨别能力,盲目信任存在风险。
“对于金融领域,一个重要特点是时效性,不断变化的宏观和微观事件对金融市场都会造成巨大的影响。而类似的AI模型的训练依赖于网络上已有的海量文本数据,具有一定的滞后性。”顾凌云表示,如果无法及时获取最新的信息并迭代模型,将对金融市场做出落后于当前时点的判断,这是一个需要注意规避的问题。
记者:余继超