OpenAI 有望推出多模态 GPT 模型

9 月 19 日，据 The Information 报道，OpenAI 意图赶在谷歌推出多模态大语言模型 Gemini 前广泛推出名为GPT-Vision 的多模态功能，此前 OpenAI 在 3 月份推出 GPT-4 时展示了多模态功能，但并未向除了 Be My Eyes 之外的公司提供，未来 OpenAI 或许会推出一个更强大的多模态大模型，代号为 Gobi。此前在 5 月 10...

OpenAI计划推出名为GPT-Vision的多模态功能，以应对谷歌推出Gemini之前的市场需求。多模态技术的重要性得到了彰显，有利于推动多模态AI应用落地。多模态模型需要处理的输入和输出信息包括文本、图像、视频、音频等，需要更复杂的模型架构和强大的算力支持。

Gemini OpenAI gpt 多模态模型架构算力支持