更关键的是,在一个更接近真实手机使用场景的基准“MobileWorld”中,它也创下了新的最高成功率记录,达到了41.7%,这证明它处理日常真实应用的潜力非常强。我需要紧急出差上海,帮我去12306查询现在最早从杭州西站去上海虹桥、有二等座票的班次,在钉钉前沿技术研讨群里把到达时间同步给大家,再把我和水番的会议日程改到明天同一时间,在群里发消息@他,礼貌解释因为临时出差调整会议时间,询问...
斑马智行与通义、高通合作推出全模态端侧大模型Auto Omni,提升智能座舱体验,支持主动服务。该方案具备全模态感知和全时空记忆能力,预计2026年量产。斑马智行还与多品牌合作,推动AI技术发展,建立互利生态系统。
阿里通义DeepResearch模型在多个评测中超越OpenAI,成为开源Agent模型的领军者。该模型通过增量预训练和后训练,利用合成数据生成高质量训练集,提升推理和决策能力,已广泛应用于阿里内部项目。
高德地图通过AI重构底层架构,推出主-从Agent系统,简化用户获取出行建议和旅行计划的流程,提升用户体验。新架构使高德从工具转变为智能体,主动满足用户需求,为行业转型提供借鉴。
斑马智行与通义、高通在2025世界人工智能大会发布了基于高通8397平台的多模态大模型解决方案,推动汽车智能座舱进入主动智能时代。该方案实现了智能座舱90%的服务闭环,用户可通过自然对话完成多项任务,提升人机交互体验。斑马智行的元神AI在多个场景中展现出强大的智能化能力,成为汽车智能化服务的新标杆。
阿里云通义灵码推出的Qwen3-Coder编程模型免费使用,提升代码生成速度和准确率,超越GPT4.1,成为全球最受欢迎的开源模型,下载量超过2000万,服务超过1万家企业。
阿里巴巴通义实验室推出的WebSailor开源网络智能体,通过后训练方法显著提升复杂网页推理能力,成为首个挑战BrowseComp基准的开源模型,缩小了开源与闭源模型的能力差距。
阿里通义实验室推出MaskSearch框架,提升大模型推理与搜索能力。小模型表现接近大模型,兼容监督微调和强化学习,显著提升开放域问答性能。通过检索增强型掩码预测任务,模型有效学习信息处理与搜索引擎使用,适应多领域任务。
阿里云推出基于VS Code的AI编程工具通义灵码(Lingma IDE),具备代码智能生成、研发问答和任务执行功能,支持Qwen3模型和MCP协议,已发布Windows和macOS客户端,并支持多种IDE插件。
阿里云推出通义灵码 AI IDE,集成多种智能编程功能,支持千问 3 模型,提升开发效率,适用于复杂开发任务,已被众多企业广泛应用。
阿里云推出通义灵码AI IDE,深度适配Qwen3模型,具备编程智能体、行间建议预测和自动记忆功能,帮助开发者高效完成复杂编程任务,支持3000多个MCP服务,已被众多企业广泛应用。
完成下面两步后,将自动完成登录并继续当前操作。