阿里巴巴通义千问团队推出适合边缘设备的小型模型,参数范围从0.8B到9B,强调以少量算力实现高智能。新模型在架构和数据质量上进行了优化,未来将推出更小的基础模型。
阿里巴巴推出千问APP,整合淘宝和支付宝等服务,并推出AI支付协议ACT,旨在实现自动消费和聊天购物。然而,现场演示出现技术问题,显示出大公司病,产品完成度低,未来电商发展仍需关注。
CodeSpirit是一个基于.NET的低代码与AI开发框架,深度集成大语言模型(LLM),提供智能表单填充和数据分析等功能,支持阿里云通义千问,适合开发者使用,且免费额度充足。
千问APP是阿里巴巴推出的AI应用,旨在与ChatGPT竞争,但面临内部竞争和产品设计复杂性等挑战。尽管引发关注,股价波动和市场反应显示出不确定性。阿里需整合资源,克服内部斗争,以在电商生态中发挥优势。
阿里巴巴于11月17日公测上线千问App,该AI助手基于通义千问Qwen模型,旨在整合地图、外卖、订票等生活场景,成为一站式服务平台。未来将推出国际版,并持续更新最新模型。
爱彼迎CEO切斯基表示,公司依赖阿里巴巴的通义千问模型,称其“比OpenAI更好更便宜”,引发硅谷热议,显示阿里巴巴在全球AI竞争中的重要进展。通义千问模型已被下载超过6亿次,成为热门开源模型。
阿里巴巴的Qwen团队成立了具身智能小分队,标志着在物理AI系统探索中的重要进展。技术负责人林俊旸表示,团队将推动多模态模型向具身智能发展,以实现AI在现实世界的操作。阿里在该领域的投资和技术布局持续加强,未来将推动AI向具身智能应用演进。
阿里云溪大会展示了阿里在AI领域的进展,强调开源模型的领先地位及与英伟达的合作,提出超越人工智能(ASI)的概念,展现中美AI发展路径的差异,未来有望创造新的商业模式。
通义千问推出的Qwen-Image是一个20B的图像生成模型,具备卓越的文本渲染和一致的图像编辑能力,尤其在中文文本渲染方面表现突出,支持复杂场景和多种艺术风格,旨在推动图像生成技术的发展。
华为开源的盘古大模型被指抄袭千问2.5 14B,相关性高达0.927。华为对此辟谣,称测试方法不科学,但未详细说明。开源协议遵循Apache 2.0,但标注不明显,引发争议,导致品牌形象受损,面临舆论压力。
Qwen3正式发布并开源8款混合推理模型,包括两款MoE模型和六个Dense模型。旗舰模型Qwen3-235B-A22B在多项基准测试中表现优异,而Qwen3-30B-A3B则在激活参数更少的情况下性能更强。模型可在多个平台上使用,推动大型基础模型的研究与开发。
阿里巴巴推出的Qwen3开源模型在编程、数学和多模态处理上取得显著进展,支持文本、图像、音频和视频的统一处理。该模型基于Apache 2.0许可协议,适合个人和企业使用,并已在HuggingFace上发布。
阿里云通义千问团队推出QwQ深度思考功能,基于QwQ思维模型,增强了数学理解、编程和推理能力。未来将开源QwQ-Max和Qwen2.5-Max模型,并推出手机官方App。
阿里云已购得Qwen.Ai域名,用于其通义千问AI平台。该域名于2023年8月注册,9月向用户开放。尽管域名不算精品,但因与阿里云开源模型相关,预计花费不菲。
Manus与阿里通义千问团队于3月11日达成战略合作,双方将利用通义千问的开源模型提升Manus功能并降低算力消耗,推动AI行业发展,满足市场需求。
阿里云于3月6日开源推理模型QwQ-32B,摩尔线程迅速支持。QwQ-32B在多项基准测试中表现优异,超越OpenAI-o1-mini,推动AI技术发展,摩尔线程积极支持开发者进行AI创新。
阿里巴巴通义千问团队开源了QwQ-32B模型,参数320亿,性能接近6710亿参数的DeepSeek-R1。该模型通过强化学习提升推理能力,支持批判性思考,尤其在数学推理和代码编写方面表现优异,已在Apache 2.0许可证下开源。
阿里云发布并开源了推理模型千问QwQ-32B,其性能与DeepSeek-R1相当,支持在消费级显卡上本地部署。该模型通过大规模强化学习提升了数学和编程能力,适合高安全性应用。用户可免费下载体验,未来将探索智能体与强化学习的结合。
本文介绍了如何使用HuggingFace Trainer组件微调通义千问0.5B模型,涵盖环境准备、数据加载和模型训练等步骤,提供简洁有效的实现方案,适合初学者。
阿里巴巴董事局主席蔡崇信确认,苹果选择通义千问作为其在中国的人工智能合作伙伴,取代百度,旨在实现设备本地化服务,尚未确定上线时间,此举可能提升iPhone在中国市场的销售表现。
完成下面两步后,将自动完成登录并继续当前操作。