2022年11月30日,发布了其最新的聊天机器人模型——(Chat Pre- ),由此引发了广泛的讨论。 是一种专注于对话生成的语言模型。它能够根据用户的文本输入,产生相应的智能回答。这个回答可以是简短的词语,也可以是长篇大论。其中GPT是 Pre- (生成型预训练变换模型)的缩写。
据报道,在开放试用的短短几天,就吸引了超过100万互联网注册用户并且社交网络流传出各种询问或调戏的有趣对话。开发商成立的一个原因是避免谷歌在人工智能领域的垄断。成立之初,它作为一个非营利组织运营,明确提出以将先进人工智能的效益民主化为使命。
早在2018年,就发布了最初版本的GPT模型,但在同年, 的BERT模型横空出世,以优异的效果吸引了几乎全部的目光。虽然以当年的眼光来看,BERT 绝对是一个更加优秀的模型。但没有放弃GPT这种生成式预训练的路线。经过GPT-2、GPT-3、GPT-3.5模型的发展更新,积累了技术、数据以及经验最终促成了如今的成功。
今年3月15日,公布了大型语言模型的最新版本—GPT-4,该版本比以前的版本“更大”,这意味着其已经在更多的数据上进行了训练,并且在模型文件中有更多的权重,这使得它的运行成本更高。它的语言理解和生成能力都超过了GPT3.5,可以解答更复杂的问题,同时可以描述并理解图片。它还新增了辨识图像的功能,可以根据资料库的分类辨识图片的差异,在理解后用文字叙述图片,连表格都可以分析解释。它还为一些应用程序提供支持,例如、Role Play等。
另外,GPT-4的文字输入限制提升至2.5万字;回答准确性显著提高;能够生成歌词、创意文本,实现风格变化。实验表明,GPT-4在各种专业测试和学术基准上的表现优良,例如,它通过了模拟律师考试,且分数在应试者的前10%左右。
作为一种先进的自然语言处理技术,已经开始为不同领域的应用提供支持。首先,在智能客服领域,可以为人们提供更快速、更准确的客户服务。通过,客户可以像与人类操作员一样与机器人聊天,实现自动回复、多轮对话等功能,快速解决问题,为客户提供更好的用户体验。还可以利用自然语言处理的技术,进行智能推荐,根据客户的历史记录和关键词识别,推荐最合适的产品和服务,提高客户满意度。
其次,在教育领域,学生可以通过获得针对性更强的学习内容和更为智能的交互。可以帮助学生消除语言障碍,解决疑难问题,并且能够记录学生的学习历程,为教师提供参考,并且对学生的学习进度进行评估。
再者,在金融领域,可以帮助金融从业者更简单地理解客户的需求,从而更好地提供相关服务。可用来扫描数据、识别趋势,并进行预测和分析,以帮助投资者做出更清晰的决策和预测股市趋势。
最后,在旅游和酒店领域,可以为用户推荐适合的酒店和旅游路线,并根据用户需求提供个性化的建议。通过,用户可以智能预定酒店和机票,安排行程,帮助用户规划最好的旅行。
除以上的领域外,在医疗、管理、娱乐、健康等领域也都发挥了极大的作用。这种自然语言处理技术的普及,不仅能够提高效率,还可以帮助人们更好地了解不同领域的信息,进一步促进各行各业的发展。
而在盛丰君所处的金融行业的应用前景非常广泛,不仅能够帮助金融机构提供更加人性化的客户服务,更能通过参与金融分析和决策,在金融行业发挥更大作用。具体来看,有潜力在以下场景辅助或改变现有金融业务模式:
1) 市场调查。金融机构需要知道他们的客户想要什么,可以进行调查和问卷调查以收集见解,然后分析该数据以生成对银行家做出决策有用的反馈。通过分析文本语言,能够帮助经营机构迅速了解市场舆情、竞品动态、员工情绪等。
2)优化运营。还可以优化各种与金融有关的流程,例如贷款申请和欺诈检测。通过自动化这些流程,金融机构可以减少手动错误并提高效率。还可以帮助金融机构节省人工成本,处理例行任务,从而为更复杂的任务释放人力资源。
3) 智能投顾。智能投顾是以人工智能为基础的一项专业的投资咨询服务,通过使用,智能投顾公司可以提供更好的个性化投资建议和服务,识别和管理投资组合中的潜在风险,并更快速地回答客户的问题和提供支持。
4) 量化策略。的能力也会对量化投资策略产生影响。通过分析大量数据并生成自然语言分析,有可能协助开发预测模型和识别市场趋势。
5) 保险行业。可以改造保险行业的诸多流程。例如,用于保险理赔过程中的自动化处理,保险公司可以使用来自动化处理理赔申请,并自动核实索赔信息,为客户提供支持和帮助,加快理赔进程,提高理赔率。甚至可以用于保险销售,通过与客户的多轮问答交互,可以理解客户的需求和偏好,推荐最适合客户的保险产品。随着与客户的持续交流,还可以长期跟踪客户的投保全流程,成为更懂得客户的终身顾问。
6) 安全和风控。可用于帮助人类分析师通过其海量神经网络数据检测欺诈行为。通过快速分析财务数据及风险数据,并生成自然语言的财务分析报告或风险评估报告,帮助公司机构快速识别机会和风险,并给出决策。还可以验证用户身份、验证信息和监控活动。
盛丰君认为,尽管在目前已经能够解决非常具体的问题,但离真正的应用还有很长一段距离。目前其本身还存在一些缺点和限制,主要体现在以下几个方面:
1) 对话能力有限:目前still处于初级阶段,它的对话能力受到很大的限制,无法像人类那样主动提出问题和深入探讨话题,也无法感知和理解某些情境中的隐含信息,限制了它的应用范围和效果。比如用户在他们的消息中使用讽刺或幽默, 可能无法理解预期的含义,提供不适当或不相关的响应。
2) 学习和训练时间长:的学习和训练需要大量的数据和算法模型,而且时间也比较长,这限制了它在实时应用场景的运用。从GPT1到GPT3,AI的训练数量甚至到了1750亿参数量之多,这也意味着天价的AI训练费用(1200万美金)以及更加巨大的工作量(这也意味着训练AI将是大量资本交火的主战场。
3) 无法理解人类情感和主观性:只能根据输入数据和算法进行分析和回答,无法真正理解人类的情感和主观性,容易产生一些误解和问题。虽然 可以产生看似善解人意的回应,但它并不具备真正的情商。它无法检测到微妙的情绪线索或对复杂的情绪情况做出适当的反应。
4) 语言能力不够灵活:由于的回答主要基于预设的语言模型,它的语言能力不够灵活,无法处理部分口语化和文化差异化的语言表达,容易出现回答不准确或模糊的情况。
5) 内容更新不及时:现阶段的AI更擅长回答一些非量化并且答案较为固定的一些常识类问题和简单任务和请求。而且它所具备的参数和数据都是过去的数据,这些数据难以被更新,意味着我们无法通过AI获得新闻或是最新的数据。
6) 不具备“记忆功能”:只是按照大量的参数不断生成语义对应的答案。因此当重复询问同样一个问题,可能会获得截然不同的,甚至是随机的答案。
7) 信息安全风险:在使用时,用户的隐私信息可能会被记录、发布或滥用,需要更好的隐私保护措施来保护用户的权益。此外,如果不加以充分的人工复核,甚至可能依据基础数据生成虚假信息宣传,在金融市场产生误导效应。
8) 知识产权风险:的主要应用场景集中于搜索领域,基本上是依靠网络抓取信息,通过深度学习等进行再加工。这种方式本质上仍不能规避数据挖掘带来的知识产权侵权问题,相关授权是否充分依旧存疑。
9) 违法犯罪风险:所涉及的深度合成技术,其“以假乱真”的智慧功能相当可能被应用于网络诈骗、盗取客户资金等场合,为金融安全带来新的问题。
尽管目前还存在上述的问题,但未来,随着应用的不断成熟,无疑将对全球金融业的发展形态产生巨大影响,改变线上化-数字化-智能化发展路径,并提高发展速度,加大对数智化转型的投入将是金融机构的共同选择。