“漂移”是指大型语言模型 (LLM) 以意外或不可预测的方式运行,偏离原始参数。发生这种情况可能是因为尝试改进复杂人工智能模型的某些部分会导致其他部分表现更差。
来自加州大学伯克利分校和斯坦福大学的研究人员进行了一项研究,评估偏差并研究 ChatGPT 流行的大语言模型 (LLM)、GPT 3.5(ChatGPT 背后的 LLM)和GPT-4 ( Bing Chat和ChatGPT Plus背后的 LLM))随着时间的推移而改变。
另外: 最好的人工智能聊天机器人
该研究比较了两位法学硕士在三月和六月解决数学问题、回答敏感问题、回答民意调查、回答多跳知识密集型问题、执行代码生成、美国医学执照考试以及完成视觉推理任务的能力。
从上面的研究结果可以看出,GPT-4 的 3 月版本在许多情况下都优于 6 月版本,最明显的是基础数学提示,其中 GPT-4 3 月版本在示例 (a) 和 (b) 中都优于 6 月版本)。
GPT-4 在代码生成、回答医学考试问题和回答民意调查方面也表现较差。所有这些情况都可以归因于漂移现象。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...