chatgpt 数据训练机制硬核科普，这就是ChatGPT

默认分类2年前 (2023)发布 admin

3,037 0 0

近期，火爆出圈，上线仅仅2个月，的活跃用户就突破一亿。不少和“聊过天”的网友纷纷感叹，“只有你想不到，没有办不成的”。

什么是？

是由美国人工智能实验室开发的一个对话AI模型，于2022年11月正式推出，因其极其出色的文本生成和对话交互能力在世界范围内迅速走红。其中GPT是 Pre- （生成型预训练变换模型）的缩写。

的演变历程

GPT是公司基于谷歌的语言模型框架而开发出来的技术。

GPT，英文全称是 Pre- ，直译过来是生成型预训练-变换器。名字前面加上chat，即“聊天生成型预训练-变换器”。

从算法模式的版本上，经历了GPT-1（2018年）、GPT-2（2019年）、GPT-3（2020年）和（2022年初）四个版本，未来有望生成新版本即GPT-4（预计2023年）。

GPT-1（2018年）：仅需要对预训练的语言模型做很小的结构改变，即加一层线性层，即可方面地应用于下游各种任务。 GPT-2（2019年）：使用zero-shot设定，基本实现一劳永逸，训练一个模型，在多个任务上都能使用。 GPT-3（2020年）不通过任何样例学习，而是利用少量样本去学习，更接近人脑学习模式。（2022年初）：经过多任务的微调后，能在其他任务上实现zero-shot预测，泛化能力极大提升。（可以理解成是GPT-3的微调版本，与GPT-3相比更擅长遵循指令，回答更真实，且有害情绪输出大幅下降）。

可以理解成是GPT-3.5的微调版本，未来有望生成新版本即GPT-4，相较于，效果更加真实，模型的无害性实现些许提升，编码能力更强。

使用的新的AI训练方法，加大“人”的反馈权重，进行训练监督策略模型、训练奖励模型（ Mode，RM）、采用PPO（，近端策略优化）三个阶段的训练，在持续参数迭代的过程中，输入奖励模型，得到优化参数。且会不断重复第二和第三阶段，通过迭代，训练出更高质量的模型。

应用方向

作为平台级的产品，在B端和C端都有广泛的应用价值