2022年11月30日,Open AI发布名为“”的对话优化语言模型。这一模型一经发布就获得了极大的关注,在各大平台引起了广泛讨论,被称为“2022最先进的聊天机器人”。
模型技术原理
本质上是一款人工智能技术驱动的自然语言处理工具,能够通过学习和理解人类的语言来进行对话,而且能完成撰写邮件、视频脚本、文案、翻译、代码等任务。本质上是一种AIGC(人工智能生成内容)工具。
应用带有人工标注反馈的强化学习( from Human ,RLHF),使用GPT3.5大规模语言模型作为初始网络结构,使用收集数据增强的进行模型训练,训练过程可以大致分为三个步骤:一是基于人工标注的“指令-答案”数据对GPT3.5进行监督学习,精调得到的大模型(SFT)能理解各式各样的任务指令,该步骤只进行一次;二是训练强化学习框架中的奖励模型(RM),使其能模拟人类对答案的偏好评分;三是输入新指令到SFT,得到答案输出,基于RM对该答案进行评分,并通过强化学习迭代机制将该评分反馈更新SFT模型,步骤二和步骤三持续重复进行,直至最终形成一个成熟稳定的模型。
技术突破使更加成熟。之所以能够具有现象级的热度,主要归功于其模型构建中实现的两个技术突破:一是人工标注反馈的强化学习,RLHF 解决了生成模型的一个核心问题,即如何让人工智能模型的产出和人类的常识、认知、需求、价值观保持一致;二是SFT策略微调模型,有效利用大模型能力,让训练过程更接近人类思维模式的同时可避免过度理解或曲解。
借助微软Azure云平台提供的超强算力,的出现使得AIGC步入新的研究范式,即以大数据预训练+小数据微调的方式,摆脱了对大量人工调参的依赖,在手写、语音和图像识别、语言理解方面的表现大幅突破,所生成的内容也越来越准确和自然,从而加速场景内容生成的高效性和应用的多样化。
应用场景图谱
根据自身回答,它可以为经营机构提供文本生成、数据分析、聊天机器人、预测分析、NLP技术方面的服务。
文本生成:为经营机构生成报告、研究文档、市场分析、公告等文本。
数据分析:帮助经营机构分析市场数据,识别有价值的信息,并对数据进行清洗、整理和可视化。
聊天机器人:为经营机构提供客户服务和咨询,以提高客户满意度。
预测分析:帮助经营机构预测股票价格、市场趋势、货币汇率等,提高投资决策的准确性。
NLP技术:使用自然语言处理技术为经营机构分析新闻、社交媒体等数据源,以寻找投资机会。
在算法成熟的基础之上,其应用层的爆发呼之欲出,应用场景非常广泛,拥有巨大的潜在应用空间,功能覆盖多个行业领域板块。因此,当前和潜在的主要应用场景分为内容生成、编程协助、创意生成、虚拟对话四大类。
内容生成类
可以AI协助内容生产的方式参与到文本写作的各个环节中去,全AI生成内容(AIGC)将是内容生成的最终形态,其生产效率高,成产成本极低。
段落创作 maker
故事创作 Story
摘要生成 Notes to
机器翻译 to other
英语语法纠正
人称转换 Third-
文本分类 ESRB
……
编程协助类
在编程协助领域应用潜力巨大。自然语言生成和代码编程有诸多相似之处,采用注意力机制的同时能实现生成代码前后的逻辑一致性,在编程领域具有良好的表现和应用落地潜力。
代码转换 to
代码编写 Write a
代码压缩 one line
程序命令生成 Text to
SQL语句生成 SQL
修复代码 Bug bug fixer
……
创意生成类
可以在创意设计、广告设计、营销文案等方面辅助从业者,提升创意生成的效率和针对性。
头脑风暴 VR idea
菜谱生成
点评生成
面试问题生成
广告设计 Ad from
……
模拟对话类
在人机对话中拥有较高的自由度,展现出更拟人的交流方式,连续对话能力也大幅提升。
聊天 chat
智能客服
搜索引擎增强
语音工作助手Voice work
……
在金融领域的典型应用
1.编程协助
在编程协助领域应用潜力巨大。自然语言生成和代码编程有诸多相似之处,采用注意力机制的同时能实现生成代码前后的逻辑一致性,在编程领域具有良好的表现和应用落地潜力。
基于前代版本GPT-3模型的智能代码生成插件 提供了片段级的代码补全功能,可以用于注释生成代码、生成单元测试等场景,其正式版定价10美元/月,据官方统计, 开放测试一年已有120万用户。
基于GPT-3.5模型的同样具有强大的代码生成能力,可以实现简单任务的完整代码编程,可以应用在代码生成、代码提示、故障诊断、自动测试等环节。下方两图为在面临相同目的、不同编码要求时生成的代码。
图1 基于完成的代码
图2 基于和完成的代码