机器之心 ·

阿里深夜开源Qwen2.5-VL新版本，视觉推理通杀，32B比72B更聪明

💡 原文中文，约1500字，阅读约需4分钟。

📝

内容提要

阿里通义千问团队发布了新模型Qwen2.5-VL-32B-Instruct，提升了人类偏好回复、数学推理和图像理解能力。与72B模型相比，32B在多模态任务中表现更佳，用户体验显著改善。团队将继续优化推理过程，以应对复杂视觉任务。

🎯

❓

该模型在回复人类偏好、数学推理和图像理解能力上有显著提升。

32B模型解决了72B模型过大和7B模型不够强大的问题，优化了主观体验和数学推理能力。

该模型在图像解析、内容识别和视觉逻辑推导等任务中表现出更强的准确性和细粒度分析能力。

用户可以在Qwen Chat上直接选择Qwen2.5-VL-32B进行体验。

团队将聚焦于长且有效的推理过程，以突破复杂视觉推理任务的边界。

该模型在复杂数学问题求解的准确性上显著提升，解题思路拆解得很详细。

🏷️

如何优化AI对话开发效果和测试开发质量？
AI对话产品的优化与测试至关重要。需建立可量化的评估体系，结合技术指标与用户体验指标。优化重点包括响应延迟、意图理解和对话体验。测试应覆盖真实场景，确保系...
微软 Build 2026 大会凸显对话式 AI 的新阶段
在微软Build开发者大会上，微软发布了MAI-Transcribe-1.5语音转文本模型和MAI-Voice-2文本转语音产品，提升了语音识别和合成语音...
是时候造一台 AI 时代的手机了｜AIDONE 第五期
在AI时代，手机成为AI应用的最佳终端。vivo与爱范儿将于6月10日在广州举办AIDONE第五期，讨论如何将AI更好地融入手机工作流，提升用户体验。参与...
23学习周刊-总第266期-2026年第23周
本周刊聚焦运维、Go语言和Vue技术生态，推荐多个优秀项目，包括基于SwiftUI的Mac终端应用muxy、轻量级剪贴板管理器Buffer和Rust开发的...
GitHub宇宙回来了：在代理时代，我们齐心协力
在2026年Microsoft Build大会上，GitHub推出了新工具和更新，旨在提升用户体验。用户可以在VS Code或CLI中开始工作，然后在手机...
SuperX首个美国AI推理云中心在丹佛投入运营
SuperX AI Technology Limited在丹佛正式启用首个美国AI推理云中心，基于NVIDIA技术，提供高性能、低延迟的AI推理服务，已被...