机器之心报道
机器之心编辑部
关于 AI 的问题,可以直接问 AI。
新上线的 可谓是火爆出圈,这个对话模型可以回答后续问题,承认错误,挑战不正确的前提,还能帮你修改代码中的 bug……
只要和它聊上几句,一会儿功夫它就能把问题给你解决了。例如用户要求:「 帮我解释一下文中正则表达式的含义。」:安排。密密麻麻的解释了一大段内容,应该是解释清楚了。
由于的性能过于优秀,网友们纷纷开始整新活,仿佛不把玩出百十个花样不罢休。更有人毫不夸张的说,这哪是个机器,这简直就是一个活脱脱的 Stack 啊。
显然,这位推特用户也有同样的感受「在短期内,我已经预见到一些网站将受到极大的威胁,Stack 就是其中之一。自从 和现在的 出现后,我使用网站的次数已经大大减少了。」
「我刚刚与 就现代物理学的历史进行了大约 20 分钟的对话。如果我在高中和大学期间有这样一位老师……OMG。我认为我们基本上可以重新审视大规模教育的概念。我们所知道的大学将不复存在。」一位网友表示。
马斯克都忍不住说了一句:「 非常好。我们离强大到危险的 AI 不远了。」
编程问答机器
作为一种对话式大型语言模型, 最擅长的就是回答用户提出的问题,最关键的是 具备与编程相关的基础知识。这就让 成为类似于 Stack 的编程问答工具,只不过回答问题的是个 AI。
首先, 可以轻松回答与计算机相关的问题:
另一方面,从网友的试用情况看, 在编程方面非常「聪明」,例如提问:「打印出一只大狗」, 就回答了一整段程序,该程序能用字符拼接成狗的形状:
当用户命令 找出一段程序的 bug 时,它不仅可以清晰地描述 bug 及原因,还能自动修复 bug,写出一段正确的程序:
会考试的
让模型去参加考试已经屡见不鲜,不知道 参加考试的话表现会怎样。有人表示,ta 已经替大家试验过了, 通过了 2022 年的 AP A 考试。最后得分 32 分,满分 36。
这门考试的难度等同于大学 CS(计算机科学)专业课第一学期难度,下面是考试内容的部分截图,看起来通过考试还是有些难度的。
还有网友让 参加了完整的 SAT 考试。SAT 全称为 Test,也叫学术能力评估测试,与 ACT 考试 ( Test) 相似,被称为「美国高考」,考试总分为 1600 分,分为阅读(400 分)、文法(400 分)和数学(800 分)三个部分,另有总分为 24 分(阅读理解 8 分,文章分析 8 分,英语写作 8 分)的作文(选考)部分。 拿到了 1020 分。根据美国大学委员会的数据,1020 这个分数段大概排在前 52% 的位置。
会编写游戏的
让 编写个小游戏不知道能不能用,对 来说,这不是个事。有用户在不到一个小时的时间里,就从头生成了一个小游戏,最关键的是用户零编码,只需输入提示就可以。如果中间有问题,告诉 ,它会帮你解决。
例如用户表示:为一款关于挖掘宝藏的游戏想出 5 个名字,名字的首字母拼写为 GPT。
:Gold Pit , Great Pit ,Grand Pit ,Grave yard Pit , Pit .
用户:我想启动一个名为 GPT( Pit )的项目,这样我们就可以一起开发游戏了。我想使用实时视图,而不是使用 ecto。我应该使用什么命令?
:mix phx.new gpt —no-ecto —live
用户:我有一个叫 GPT 的应用。我们要做一款游戏。为这个应用程序写一个 模块,它有 3 个元素:标题需要写着「GPT: , Pits & 」;从 0 开始的 Gems 计数器;一个写着「Dig up the next grave」的按钮。当我点击按钮时,我要么获得 10 个宝石,要么掉进坑中死亡的几率是 50%。如果我死了,gem 计数器就会显示「You fell into a pit. You are dead。」
给出了一个代码链接,然后给出了一些说明。
在之后的用户和 的对话中,用户遇到的问题, 逐一帮助解决,最后用户生成了一个在线可玩的游戏,如下图所示。
此外, 虽是一个对话式的语言模型,它本身不能生成多模态内容,但我们可以把它看作一个中间模型,比如把 和 结合使用。
例如,有网友要求 生成随机的艺术 ,然后把 作为 的输入,结果生成了一副艺术性很强的画作。
这种不指定具体生成内容,只说明领域的内容生成方式或许能够打开 AIGC 的新思路。
当然,作为一个AI模型, 的性能还有提升空间,特别是对于各种具体应用。研究团队表示,后续将根据用户反馈继续改进 ,避免该模型随机生成错误内容。
参考链接: