OpenAI 有望推出多模态 GPT 模型
原文中文,约900字,阅读约需3分钟。发表于: 。9 月 19 日,据 The Information 报道,OpenAI 意图赶在谷歌推出多模态大语言模型 Gemini 前广泛推出名为GPT-Vision 的多模态功能,此前 OpenAI 在 3 月份推出 GPT-4 时展示了多模态功能,但并未向除了 Be My Eyes 之外的公司提供,未来 OpenAI 或许会推出一个更强大的多模态大模型,代号为 Gobi。 此前在 5 月 10...
OpenAI计划推出名为GPT-Vision的多模态功能,以应对谷歌推出Gemini之前的市场需求。多模态技术的重要性得到了彰显,有利于推动多模态AI应用落地。多模态模型需要处理的输入和输出信息包括文本、图像、视频、音频等,需要更复杂的模型架构和强大的算力支持。