在 首次亮相四个月后,近日,开发商发布了更强大的GPT-4版本,这个版本堪称“王炸”产品。
新版本的GPT-4是一个多模态大模型,能够接受图像和文本输入,并生成人类水平的文本输出。GPT-4的升级主要在于识图能力,回答准确性也显著提高,能够生成歌词、创意文本,并实现风格的变化,在各种专业和学术基准上表现出人类水平的性能。
相比于基于GPT-3.5的,GPT-4最大的提升是可以处理图像,并能够理解图片的内容。它可以准确地回答出图片中事物的名称,甚至能解释表情包的笑点。在官方演示中,GPT-4还能识别手绘网站图片,并根据要求实时生成手绘一样的网站。
除了普通图片,GPT-4还能处理更复杂的图像信息,例如表格、考试题目截图、论文截图、漫画等。它能根据专业论文直接给出论文摘要和要点,并能够识别食材图中的原料并举例可做成的食物。
GPT-4的画图功能更强大,还可以完成复杂的报税工作,并附带完整的计算过程和条款解释。
GPT-4的文字输入限制提升至2.5万字,是前一代的3倍,并且回答准确性也显著提高,能够生成歌词、创意文本,并实现风格的变化。
GPT-4已经在各种专业和学术基准上表现出与人类水平相当的性能,甚至在美国高考中获得了1410分的高分,得分高于88%的应试者。
在代码修bug的实际应用中,GPT-4也展示出超凡的能力,只需要将1万字的程序文档传给GPT-4,并附上出现的问题,GPT-4在几秒钟内就给出了解决办法。
同时,在可控性方面,GPT-4有了长足的进步,有一个额外的安全奖励信号,通过训练模型拒绝对有害的内容的请求,来减少有害的输出。
值得一提的是,虽然GPT-4在做题能力和图像处理方面有了质的飞跃,并且有了长足的进步,但仍存在局限性,GPT-4与早期的GPT模型具有相似的局限性,它仍然是基于2021年9月之前的数据训练的,所以缺乏对现状的有效理解。
目前,仅向花费20美元订阅了 Plus版本的用户提供GPT-4,而开发人员可以通过等待候补名单获得访问权限。