阿里千问Qwen-VL在几个基准AI上优于GPT-4V和Gemini
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
Qwen-VL系列模型推出了两个增强版本:Qwen-VL-Plus和Qwen-VL-Max,提升了图像推理能力、细节识别和高清晰度图像支持。在多模态任务中表现优秀,超越了之前的开源模型。Qwen-VL-Max在中文问题回答和文本理解任务上超越了OpenAI的GPT-4V和谷歌的Gemini。
🎯
关键要点
- Qwen-VL系列模型推出了两个增强版本:Qwen-VL-Plus和Qwen-VL-Max。
- 这两个版本显著提升了图像推理能力和细节识别。
- 支持百万像素以上的高清晰度图像及各种宽高比的图像。
- 在多模态任务中,这两个模型的表现与Gemini Ultra和GPT-4V相当,超越了之前的开源模型。
- Qwen-VL-Max在中文问题回答和文本理解任务上超越了OpenAI的GPT-4V和谷歌的Gemini。
➡️