“全球首个AI人工智能软件师”被质疑造假!眼下的AI编程究竟有没有夸大、炒作的嫌疑?
“全球首位AI工程师”Devin,是由 Labs于今年3月12日发布的一项AI编程产品,在官网发布的长达1分50秒的演示视频里,Devin只需一句指令,就能实现端到端地处理整个开发项目,此外视频显示它具备自主学习新技术、端到端构建和部署应用、自主查找和修复代码问题等能力;还可以按照用户需求同时执行多步骤工作流程,程序员们可以实时观察其进度,发现错误时,跳出指令就能修正。
AI背后的团队成员共10人,核心团队共有3人,分别是Scott Wu、 Hao和 Yan,团队非常年轻。全体成员共拥有10枚国际信息学奥林匹克竞赛(IOI)金牌,很多成员在青少年时期也参加过信息学国际奥林匹克竞赛等。
在发布“全球首个AI程序员Devin”这一信息后, AI备受外界关注。公开资料显示,此前, AI已经获得了彼得·蒂尔的 Fund基金领投的2100万美元A轮融资。
4月9日,一位自称有35年软件工程师经验的网络博主卡尔逐帧复现了Devin的演示视频并提出四点质疑,包括Devin所展示的编程能力存在一定欺骗性,“它处理的任务并非随机,而是演示者精心选择的刻意呈现”;此外,Devin在操作过程中看似修复了许多问题,但这些问题很多都是Devin的“自导自演”。
质疑视频发出后,引发众多科技爱好者评论。虽然不可否认,AI如今已经成为程序员的必用工具之一。但卡尔的质疑也是有理由据。
质疑的合理性:卡尔对Devin演示视频的质疑,特别是关于“他们搜索过这个任务”的发现,表明视频内容可能经过了选择和安排。这种怀疑是合理的,因为它暗示了演示可能并不完全反映Devin在随机任务上的性能。
“自建自修”的情况:如果Devin在演示中确实出现了生成并修复自身错误代码的情况,这可能表明系统在效率和准确性上存在问题。这种自我生成错误再自我修正的行为,可能并不反映其在实际编程任务中的表现。
演示与实际操作的时间差异:卡尔提到他复现Devin的工作仅用了35分55秒,而演示视频显示的时间跨度为6个小时20分钟。如果这一差异真实存在,这可能表明Devin在某些方面的速度和效率被夸大了。
AI炒作的担忧:卡尔对Devin团队可能存在的“AI炒作”行为表示担忧,这是一个重要的视角,因为过度炒作可能会对公众的期望造成误导,并可能对AI技术的长期发展产生不利影响。
AI程序员的实际能力:AI程序员如Devin,确实能在一定程度上减少重复性编程任务,提高效率。但它们在逻辑理解、创新性任务和复杂问题解决方面可能还有局限。
商业炒作与实际应用:商业炒作可能会导致对AI能力的过度夸大,而实际应用中,AI工具如Devin可能更适用于辅助人类程序员,而不是完全取代他们。
业内人士对Devin的质疑表示认同,上海市人工智能行业协会、大模型专班负责人王逸浩指出,尽管存在夸大的嫌疑,但AI编程工具的发展和程序员对这些工具的依赖是不容忽视的趋势。
AI编程的确需要保持警惕,就像这本《AI撞到长寿》所说的一样:当有一天AI研究人员开始像我们一般人一样依赖AI技术的时候,人类从AI中吸取的价值观,世界观将走向何方
323AI导航网发布