6月13日,发布了gpt-3.5-turbo、gpt-4关于函数调用和其他 API 的更新,包括更多可操纵的API模型、函数调用功能、更长的上下文以及更低的价格。
其中,嵌入模型成本降低75%,降至每1K令牌0.0001美元,gpt-3.5-turbo的输入令牌成本降低25%,提供远超之前4K长度的16K上下文。
具体来看,更新主要有以下方面:
函数调用
开发者现在可以将函数描述给gpt-4-0613和gpt-3.5-turbo-0613,并让模型智能地选择输出一个包含调用这些函数所需参数的JSON对象。这是将GPT的能力更可靠地连接到外部工具和API的新方法。
这些模型已经针对检测何时需要调用函数(取决于用户输入)以及响应符合函数签名的JSON进行了微调。函数调用允许开发者更可靠地从模型中获取结构化数据。
例如,开发者可以:
1.创建通过调用外部工具(如插件)回答问题的聊天机器人
将查询(如“给Anya发电子邮件,看看她是否想在下周五喝咖啡”)转换为类似于(to: , body: )的函数调用,或将“波士顿的天气如何?”转换为(: , unit: '' | '')这样的函数调用。
2.将自然语言转换为API调用或数据库查询
将“本月我的前十名客户是谁?”转换为内部API调用(如enue(: , : , limit: int)),或使用(query: )将“Acme公司上个月订了多少单?”转换为SQL查询。
3.从文本中提取结构化数据
定义一个名为(: [{name: , : , : }])的函数,以提取维基百科文章中提到的所有人物。
这些用例在/v1/chat/端点中的新API参数、和启用,使开发者能够通过JSON 向模型描述函数,并可选地要求它调用特定的函数。如果您发现函数调用有改进的空间,请参阅开发人员文档并添加evals。
新模型
1.GPT-4
gpt-4-0613包含一个更新和改进的模型,带有函数调用。gpt-4-32k-0613包括与gpt-4-0613相同的改进,以及扩展的上下文长度以更好地理解较大的文本。
2.GPT-3.5 Turbo
gpt-3.5-turbo-0613包含与GPT-4相同的函数调用以及通过系统消息提供更可靠的引导功能,这两种功能使开发人员能够更有效地引导模型的响应。
gpt-3.5-turbo-16k提供了比gpt-3.5-turbo多四倍的上下文长度,但价格是其两倍:每1K输入令牌的价格为0.003美元,每1K输出令牌的价格为0.004美元。16k上下文意味着现在模型可以在单个请求中支持约20页文本。
3.模型弃用
今天将开始升级和弃用在三月宣布的初始版本的gpt-4和gpt-3.。使用稳定模型名称(gpt-3.5-turbo、gpt-4和gpt-4-32k)的应用程序将自动升级到上述新模型,于6月27日生效。
需要更多时间过渡的开发人员可以继续使用较旧的模型,在API请求的“model”参数中指定gpt-3.5-turbo-0301、gpt-4-0314或gpt-4-32k-0314。这些旧模型将于9月13日之后可供访问,在此之后指定这些模型名称的请求将失败。可以通过模型弃用页面了解有关模型弃用的最新信息。
降低价格
1.嵌入
text–ada-002是受欢迎的嵌入模型,其成本降低了75%,降至每1K令牌0.0001美元。
2.GPT-3.5 Turbo
gpt-3.5-turbo的输入令牌成本降低了25%。开发人员现在可以使用该模型,每1K输入令牌仅需0.0015美元,每1K输出令牌仅需0.002美元,相当于每美元约700页。
gpt-3.5-turbo-16k的价格将为每1K输入令牌0.003美元和每1K输出令牌0.004美元。