chatgpt如何识别图片内容 OPENAI为ChatGPT推出多模态版本 可以语音对话以及识别图像内容

默认分类1年前 (2023)发布 admin
2,030 0
ChatGPT国内版

昨天晚上宣布 将支持语音对话,该功能仅限于 和 iOS 版 ,并且可以上传图片由 进行分析、识别并给出回答。

当这个功能可用后,用户转到 设置里点击新功能,然后就可以开启语音对话功能,还可以从 5 个声音里选择一个。

表示:

新的语音功能由心的文本转语音模型提供支持,能够仅从文本和几秒钟的样本语音中生成类似人类的音频。我们与专业配音演员合作创作了每一个声音,我们还使用我们的开源语音识别系统 将您的声音转录为文本。

第二个功能是图像识别功能,用户可以使用移动端 拍照或选择照片发送给 AI,然后 会像素级分析图片内容并按照用户提问给出详细的回答,例如分析工作图表、在设备工作异常时进行故障排除等等。

chatgpt如何识别图片内容 OPENAI为ChatGPT推出多模态版本 可以语音对话以及识别图像内容

表示:

图像理解由多模态 GPT-3.5 和 GPT-4 提供支持,这些模型将其语言推理技能应用于广泛的图像中,例如照片、屏幕截图、包含文本的和图像的文档等。

新功能将在接下来几周推出,首先获得该功能的是 Plus 和企业版用户,不过这些功能也会在后续支持免费版用户,同时也会开放 API 给开发者们。

最后, 上周推出了图像生成模型 DALL-E 3,这个模型将可以与 集成,将在 10 月份推出。

chatgpt如何识别图片内容 OPENAI为ChatGPT推出多模态版本 可以语音对话以及识别图像内容

© 版权声明
广告也精彩

相关文章

暂无评论

暂无评论...