文|陈根
3月1日,官方宣布,正式开放,这意味着,开发者现在可以通过API将和模型集成到他们的应用程序和产品中。也就是说,企业或个人开发者无需再自研类,就能直接使用这样的模型来做二次应用和开发。
最重要的是, API的价格比其他现有的语言模型要便宜得多的成本——每输出100万个单词,价格才2.7美元(约18元人民币),比之前的GPT-3.5,成本直接降低了90%。这无论对于企业还是个人开发者,都是重大利好,人手一个的AIGC时代,或许真的就要到来了。
开放 API
API,其实就是为两个不同的应用之间实现流畅通信,而设计的应用程序编程接口,通常被称为应用程序的“中间人”。
实际上,生活中我们经常会接触到硬件接口,最常见的就是HDMI接口和USB接口,我们知道接入某个接口就能实现某种功能。和硬件接口一样,程序接口能够将程序内部实现的功能封装起来,使得程序像一个盒子一样只留出一个口子,人们接入这个口子就能使用这个功能。调用的人可以很方便使用这些功能,并且可以不需要知道这些功能的具体实现过程,接口API就是按照作者规定的流程去调用这些功能。
打个比方,我们到商店里扫码点餐,我们首先需要扫描二维码进入页面,输入就餐人数,然后一顿点餐并提交订单。点完后,服务员会来跟你核对菜单,然后同步到后厨,最后我们就坐等上菜。其中,扫码点餐过程就可以看成是API接口的工作过程,我们通过一个点餐的API接口选中菜品,让服务员在后台知道我们的需求并提供相应的饭菜和服务,这个过程就是点餐API接口的作用。
在未开放API之前,人们虽然能够与进行交流,但却不能基于进一步开发应用。而近日,3月1日,官方则宣布,开发者可以通过API将和模型集成到他们的应用程序和产品中。其中, API是去年9月推出的由人工智能驱动的语音转文本模型。
具体来看, API 由 背后的 AI 模型提供支持,该模型被叫做GPT-3.5-turbo。根据 的说法,它比 、GPT- 3.5 更快、更准确、更强大。 API 的定价为每 1000 个 Token(约为 750 个单词)0.002 美元,比现有的GPT-3.5模型还要便宜90%。而 API 之所以能这么便宜,在一定程度上要归功于“系统范围的优化”。
称这样做将比直接使用现有的语言模型要便宜得多。对此,总裁兼主席Greg 对外透表示,“API一直在我们的计划中,只不过我们需要一段时间来使这些API达到一定的质量水平。”现在时间已到, API便正式对外开放。
现在,已经有几家公司接入 API来创建聊天界面。比如,Snap公司就为+订阅用户推出了My AI,这是一项基于 API的实验性功能。据了解,这个可定制的聊天机器人不仅可以提供建议,甚至可以在几秒钟内为朋友写个笑话。目前,的月活用户已经达到7.5亿。
通过 API,为自家用户量达到1亿的应用程序Shop创建了一个“智能导购”。当消费者搜索产品时,AI就会根据他们的要求进行个性化的推荐。据了解,Shop的AI助理将通过扫描数百万种产品来简化购物流程,从而帮助用户快速找到自己想要的东西。
是一个6000多万学生都在使用学习平台。过去三年,与合作,在多个用例中利用GPT-3,包括词汇学习和实践测试。随着 API的推出,也发布了Q-Chat——一个可以基于相关的学习材料提出自适应问题,并通过富有趣味性的聊天体验来吸引学生的“AI老师”。
还在不断改进其模型,并希望将增强功能也提供给开发人员。
智能时代的技术底座
显然,支持许多不同应用的 API 是一个强大的工具,此前,有些开发者试着自己在应用中接入的常规GPT API,却无法达到的效果。这次,正式打开了官方的 API,为广大开发者打开了新的大门。
对于大多人企业和开发人员来说,开发如同这样的自己的聊天机器人模型是完全遥不可及的,根据估算,一次性训练用就达8.4亿美元,生成一条信息的成本在1.3美分左右,是目前传统搜索引擎的3到4倍,这是培育的成本。就因为钱不够烧,也曾差点倒闭。的成功也规定了入局的门槛,后来者必须同时拥有坚实的AI底座和充裕的资金。但此次官方将 API正式打开,且其花费的价格并不高,为开发人员构建聊天机器人打开大门。
更重要的是, API 的公布,为通用人工智能提供了一条现实途径。按照是否能够执行多项任务的标准来看,已经具备了通用AI的特性——被训练来回答各种类型的问题,并且能够适用于多种应用场景,可以同时完成多个任务,比如问答、对话生成、文本生成等。这说明,它不仅仅是针对某一特定任务进行训练的,而是具有通用的语言处理能力。因此,我们也可以把认为是一种通用AI模型。
而 API 的发布,让人人都可以使用这种通用AI模型,可以说, API 为AI的发展构建了一个完善的底层应用系统。
这就类似于计算机的操作系统一样,计算机的操作系统是计算机的核心部分,在资源管理、进程管理、文件管理等方面都起到了非常重要的作用。在资源管理上,操作系统负责管理计算机的硬件资源,如内存、处理器、磁盘等。它分配和管理这些资源,使得多个程序可以共享资源并且高效地运行。在进程管理上,操作系统管理计算机上运行的程序,控制它们的执行顺序和分配资源,它还维护程序之间的通信,以及处理程序间的并发问题。文件管理方面,操作系统则提供了一组标准的文件系统,可以方便用户管理和存储文件。
操作系统和iOS操作系统是目前两种主流的移动操作系统,而 API的诞生,也为AI应用提供了技术底座。虽然是一个语言模型,但与人对话只是的表皮,而的真正作用,是我们能够基于这个开源的系统平台上,开放接口来做一些二次应用。
未来,AI,或许将成为和水电力一样的基础设施。 1764年,一位叫哈格里夫斯的英国纺织工,发明了一种珍妮纺纱机一样,珍妮纺纱机可以同时纺8卷线,大大提高了生产效率。“珍妮纺纱机”的出现,引发了发明机器进行技术革新的连锁反应,揭开了工业革命的序幕。
随着机器生产越来越多,18世纪中叶,英国率先进入工业革命。当时,蒸汽机用的能源还是煤炭,正是基于煤炭这种远超人力的能源,人类的生产效率才能大大提高。又因为效率的提升,煤炭价格就变得非常的低廉。 现在的AI几乎就是那时的煤炭,因为未来的智能,一定会变成整个社会的最基础的设施、大众商品。就像我们在现实生活中离不开水、电、燃气、网络这些必需的生活要素一样,人工智能的技术底座,就是智能时代的基础设施。
可能存在的问题
不可否认, API的诞生,也有的商业诉求,鉴于 在获得微软数十亿美元的投资后扭亏为盈的压力越来越大,这不足为奇。但在宣布正式开放 API的同时,的官方博客中也谈道,他们认为人工智能可以为每个人提供难以置信的机会,而实现这一目标的最佳方式就是让每个人都可以利用它进行开发。
当然,在畅想未来的同时,人们也有对于 API的担忧。最被诟病的一大缺点就是准确率的问题。不管是上一代GPT-3还是现在的,都会犯一些可笑的错误,这也是这一类方法难以避免的弊端。
因为本质上只是通过概率最大化不断生成数据而已,而不是通过逻辑推理来生成回复:的训练使用了前所未有的庞大数据,并通过深度神经网络、自监督学习、强化学习和提示学习等人工智能模型进行训练。目前披露的的上一代GPT-3模型参数数目高达1750亿。
在大数据、大模型和大算力的工程性结合下,才能够展现出统计关联能力,可洞悉海量数据中单词-单词、句子-句子等之间的关联性,体现了语言对话的能力。正是因为是以“共生则关联”为标准对模型训练,才会导致虚假关联和东拼西凑的合成结果。许多可笑的错误就是缺乏常识下对数据进行机械式硬匹配所致。
也就是说,虽然能够通过所挖掘的单词之间的关联统计关系合成语言答案,但却不能够判断答案中内容的可信度,由此而导致的错误答案一经应用,就有可能对社会产生危害,包括引发偏见,传播与事实不符、冒犯性或存在伦理风险的毒性信息等等。而如果有人恶意的给投喂一些误导性、错误性的信息,将会干扰的知识生成结果,从而增加了误导的概率。
并且,根据网络信息,人们还能能够提示 以种族主义和性别歧视的方式回答问题,也就是说,最初接受训练时所依据的有偏见的数据。
——以及类似的系统——也容易受到基于提示的攻击,或恶意的对抗性提示,使他们执行不属于其原始目标的任务。 上的整个社区都在寻找“越狱” 并绕过 实施的任何保护措施的方法。比如,初创公司 Scale AI的一名员工就能够让泄露其内部技术运作的信息。
总的来说,开放和 API,不管是为了抢夺市场的商业策略,还是希望所有开发者共同参与模型功能的迭代,开发出更有商业价值和创造力的应用,都已经真正打开了通用人工智能时代。