OPENAI为ChatGPT推出多模态版本 可以语音对话以及识别图像内容

💡 原文中文,约700字,阅读约需2分钟。
📝

内容提要

OPENAI宣布ChatGPT将支持语音对话和图像识别功能,语音由文本转语音模型提供支持,图像识别由多模态GPT-3.5和GPT-4提供支持,这些功能将在几周内推出。同时,OPENAI还推出了图像生成模型DALL-E 3,将在10月份与ChatGPT集成。

🎯

关键要点

  • OPENAI宣布ChatGPT将支持语音对话功能,仅限于Android和iOS版本。

  • 用户可以上传图片,ChatGPT将进行分析和识别。

  • 语音功能由文本转语音模型支持,能够生成类似人类的音频。

  • 图像识别功能由多模态GPT-3.5和GPT-4提供支持,能够进行像素级分析。

  • 新功能将在几周内推出,首先面向ChatGPT Plus和企业版用户,随后支持免费版用户。

  • OPENAI还推出了图像生成模型DALL-E 3,将在10月份与ChatGPT集成。

➡️

继续阅读