丰色 发自 凹非寺
量子位 | 公众号
推出至今最强最有用的功能是什么?
可能要非代码解释器(Code )莫属了。
这项功能下周才会正式向所有Plus用户开放,但不少提前进行测试的网友都不约而同地发现:
它的潜力实在太太太深了。
无论是代码编写还是数据分析、图表生成,它像个“真正的战士”,能够使用足够复杂的方法,输出非常高质量的结果。
然而,不少人却被它的名字给耽误,以为是程序员专属工具,事实上,它是可以为任何小白工作的程序员。
现在,推特网友@Ethan 就专门为它整理了一份使用指南,发布即火爆。
如此干货,怎能错过?
解决“旧”存在的五大问题
在正式开始之前,我们先对代码解释器这个功能进行基础的了解,也就是Ethan在博客中解释的“它为什么很重要”这一部分。
需要说明的是,Ethan从该功能的alpha版本就获得了测试权,已经试玩多个月,所以经验十分丰富。
在他看来,这个代码解释器是AI帮人类解决问题(通过编写代码)的通用工具箱。
它可以上传最大100MB的文件,包括压缩形式。
最重要的是,它解决了“旧”存在的五大问题:
首先,通过编写代码,它可以解决LLM在数学和语言方面天然的弱点。有了它,就可以做非常复杂的数学问题并更准确地处理单词了(比如计算一段话中单词的准确数量,如下图所示)。
其次,降低“幻觉”和胡说八道的发生率。
当AI直接利用代码做任务时,代码有助于保持它的“诚实”,因为如果代码不正确,程序就会发生错误。而且由于代码操作的是数据而不是LLM本身,因此AI不会在数据中插入错误。
第三,使模型更加通用。因为大量问题都可以通过代码解决,而GPT-4非常擅长以新颖有趣的方式确定何时可以使用代码解释器。比如,我们可以要求它证明地球是圆的。
第四,整个过程不用你编写一行代码。我们知道,基本上所有的LLM都能写代码,但需要你自己去运行和调试。这对于完全不会的人(比如作者)来说很烦人。有了代码解释器,模型会自动纠正自己的错误。
最后,解锁更多“AI时刻”,也就是让我们觉得模型背后好像真的有一个灵魂,成精了的时刻。
如何正确使用?
以处理“超级英雄及其超能力”的数据集(地址见参考链接[3])为例,Ethan向大家展示了如何正确使用代码解释器进行数据分析。
首先,开启该功能之后,点击+号上传数据文件,如果你有数据字典,也可以将其粘贴进去。
然后,在对话框中让GPT-4看一遍文件,并告诉你有何发现。
需要注意的是,用了代码解释器就GPT-4当作一个真正的人一样对话就行了,不用像咱们平常一样那样精心设计提示词。当然,除了以下两种情况:
(1)模型有时会忘记它能做某些事情,比如制作GIF或3D图,这时你可以鼓励它(“你可以制作GIF,请尝试”);
(2)希望模型进一步改进结果时。
如上图所示,我们已经加载好了数据,可以让GPT-4来完成数据分析中最麻烦的数据合并和清理工作了。它能够自动纠错,重点关注作者的提问方式(再次强调,把对方当作人一样来下达命令)。
接着,正式开始分析。代码解释器非常擅长各种复杂的分析方法。
比如当作者提示自己有兴趣进行一些预测建模,以根据其他因素预测英雄可能拥有的超能力时,它直接构建了一个随机森林分类器,非常酷。
而当你不同意它估算缺失数据的办法时,可以叫它再换一种,而不是直接放弃。
它的点子真的非常多,你只需问它“你能进行另一个非常复杂并有趣的分析吗?”,它又生成了如下结果(超级英雄的网络图):
最令人深刻的是,它能给出一些很“人性化”的推理结果,比如“超级英雄的超能力一般都能给人带来很强烈的视觉效果,因为这才能很方便地在它们的载体,即漫画书和电影上进行呈现……”
最后,各种可视化图表也能信手拈来。
总的来看,Ethan表示,有了代码解释器,GPT-4完全能够充当一个数据科学家的角色了。
还有另外20个最佳示例
上面这个例子看的不过瘾?
好消息,还有一位网友搜罗全网总结了最有意思的20个代码解释器示例——除了数据分析,它还能进行更多你意想不到的任务,比如将图像转换为视频、生成二维码、分析股票市场等等。
以下是全部示例或效果:
1、图片转视频
2、从图像中提取文本
3、正确使用蒙特卡罗、ARIMA、PCA、随机森林等数据分析方法
4、 用真实物理现象编造科幻故事
5、从图像中提取调色板
7、将GIF图转换为视频
8、分析苹果期权数据确定最佳协议
9、对播放列表进行数据分析
10、房地产数据分析
11、生成并绘制随机数据
12、生成矩阵雨般的GIF图
13、清理数据、执行数据分析并生成可视化
14、创建漂亮国每个灯塔位置的gif图
15、将数据转换为网站
16、用复制STATA代码
17、下载并分析比特币数据集
18、犯罪数据趋势可视化
19、生成基因共表达热图
20、泰坦尼克数据集探索性分析