chatgpt如何识别图片内容 OPENAI为ChatGPT推出多模态版本可以语音对话以及识别图像内容

默认分类2年前 (2023)发布 admin

2,044 0 0

ChatGPT国内版

昨天晚上宣布将支持语音对话，该功能仅限于和 iOS 版，并且可以上传图片由进行分析、识别并给出回答。

当这个功能可用后，用户转到设置里点击新功能，然后就可以开启语音对话功能，还可以从 5 个声音里选择一个。

表示：

新的语音功能由心的文本转语音模型提供支持，能够仅从文本和几秒钟的样本语音中生成类似人类的音频。我们与专业配音演员合作创作了每一个声音，我们还使用我们的开源语音识别系统将您的声音转录为文本。

第二个功能是图像识别功能，用户可以使用移动端拍照或选择照片发送给 AI，然后会像素级分析图片内容并按照用户提问给出详细的回答，例如分析工作图表、在设备工作异常时进行故障排除等等。

chatgpt如何识别图片内容 OPENAI为ChatGPT推出多模态版本可以语音对话以及识别图像内容

表示：

图像理解由多模态 GPT-3.5 和 GPT-4 提供支持，这些模型将其语言推理技能应用于广泛的图像中，例如照片、屏幕截图、包含文本的和图像的文档等。

新功能将在接下来几周推出，首先获得该功能的是 Plus 和企业版用户，不过这些功能也会在后续支持免费版用户，同时也会开放 API 给开发者们。

最后，上周推出了图像生成模型 DALL-E 3，这个模型将可以与集成，将在 10 月份推出。

热

☍

chatgpt如何识别图片内容 OPENAI为ChatGPT推出多模态版本可以语音对话以及识别图像内容

门

☍

推

☍

荐

☍

# 默认分类 # 文本分析 # 机器学习

© 版权声明

文章版权归作者所有，未经允许请勿转载。

广告也精彩

相关文章

人工智能chatgpt核心技术是什么深度剖析：ChatGPT 及其继任者会成为通用人工智能吗？

admin

4,541 0

智能ai工具这7个惊人的AI工具，不管你从事什么工作都能够用到

admin

3,557 0

孙正义AI狂言：狂撒1万亿只“蒙对”一家，行业震动！

wangzhan

4,838 10

chatgpt迭代运算一次需要什么芯片杰克·唐加拉 | ChatGPT并非“超算大脑”，量子芯片或引领行业跨越式飞跃

admin

5,034 0

ai报表软件 GitHub Star 13.9k，顶级项目全新开源表格识别算法

admin

1,046 0

ai绘画专业软件最前线 | 助AI绘画独角兽Stability AI全球走红

admin

2,551 0

暂无评论

暂无评论...

323AI导航网（323ai.com）—— 精选全球实用AIGC工具箱。 AI人工智能爱好者使用学习必备导航网站，收录了国内外5000+优质AI实用工具网址，一个专业、全面、实用的AIGC工具与AI资讯导航网站，我们聚焦于最新的AI文本、AI绘画、AI视频、ChatGPT、Stable-Diffusion、Midjourney等AI项目，帮助用户发现最前沿的AIGC项目，探索人工智能的无限可能。

友链申请免责声明广告合作关于我们

Copyright © 2025 323AI导航网陕ICP备2023007327号-3