小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate

蚂蚁与清华合作推出开源强化学习框架AReaL-boba,显著降低数学推理模型的训练成本与时间。仅需200条数据和200美元即可复现QwQ-32B模型,其推理能力可与顶尖模型媲美。该框架全面开源,包含训练代码、数据及技术笔记,推动AI训练的普惠化。

超低成本复现QwQ!数学推理模型训练迎来RL暴击,数据代码全开源 | 蚂蚁&清华出品

量子位
量子位 · 2025-04-01T03:06:32Z
200美金,人人可手搓QwQ,清华、蚂蚁开源极速RL框架AReaL-boba

蚂蚁技术研究院与清华大学推出开源强化学习框架AReaL,旨在简化大语言模型训练。最新版本AReaL-boba在训练速度和推理能力上表现优异,仅需200条数据即可高效训练,降低成本。该项目完全开源,支持社区复现与改进,推动AI训练的普惠发展。

200美金,人人可手搓QwQ,清华、蚂蚁开源极速RL框架AReaL-boba

机器之心
机器之心 · 2025-03-31T02:52:03Z

阿里云通义千问团队推出QwQ深度思考功能,基于QwQ思维模型,增强了数学理解、编程和推理能力。未来将开源QwQ-Max和Qwen2.5-Max模型,并推出手机官方App。

阿里云通义千问在AI对话平台推出QwQ深度思考模型 具有更强的推理和创造力

蓝点网
蓝点网 · 2025-03-21T16:43:29Z
🔥 Gemma 3 27B与QwQ 32B与Deepseek R1的比较 ✅

2025年3月,阿里巴巴发布了QwQ 32B模型,谷歌推出Gemma 3 27B模型。QwQ在编码任务中表现优异,而Gemma 3在推理任务上表现突出。Deepseek R1模型在推理和数学问题上也表现良好。总体而言,QwQ 32B在编码测试中领先,但Deepseek R1在推理和响应时间上更为均衡。

🔥 Gemma 3 27B与QwQ 32B与Deepseek R1的比较 ✅

DEV Community
DEV Community · 2025-03-20T13:36:27Z

Qwen团队发布的QwQ-32B模型拥有320亿参数,在代码生成和对话任务中表现优异,推理能力接近DeepSeek-R1。vLLM架构的更新提升了性能,支持高效部署。OpenManus项目为开发者提供低成本构建智能体的解决方案。

开源顶流集结!QwQ-32B 解锁多元玩法,OpenManus 低成本构建 AI 智能体!vLLM v1 赋能高效模型推理

HyperAI超神经
HyperAI超神经 · 2025-03-14T08:13:37Z
QwQ-32B是什么?如何免费使用QwQ-32B?

QwQ是Qwen系列的推理模型,具备出色的思考和推理能力,特别在数学和编程任务上表现优异。QwQ-32B模型拥有320亿参数,经过强化学习训练,回答速度快且准确性高。

QwQ-32B是什么?如何免费使用QwQ-32B?

文武科技柜
文武科技柜 · 2025-03-13T01:52:21Z

随着AI模型的发展,GPU算力变得愈发重要。DeepSeek平台为新用户提供5000万token和GPU资源,注册后可轻松使用。企业用户还可获得500元代金券,降低开发成本,适合AI爱好者和开发者进行实验与应用。

注册即送500元代金券!白嫖GPU算力部署QwQ-32B目前唯一支持function的推理的开源模型白嫖DeepSeek-R1...

dotNET跨平台
dotNET跨平台 · 2025-03-12T23:59:04Z

Manus与阿里通义千问团队达成战略合作,基于开源模型实现功能。阿里云推出强大的开源QwQ-32B。MetaGPT团队发布的开源版OpenManus已获得29k+星标,支持模块化定制AI助手。HyperAI提供教程和福利,方便用户体验OpenManus。

在线教程 | OpenManus 与 QwQ-32B 强强联合,推理过程全透明

HyperAI超神经
HyperAI超神经 · 2025-03-12T07:48:43Z

TOKENSWIFT框架通过优化模型加载、KV缓存管理和Token生成策略,实现超长文本生成效率提升,生成10万Token仅需90分钟,传统方法需5小时,确保生成质量与多样性,支持DeepSeek-R1和QwQ,具有3倍加速效果。

90分钟生成10万Token,新框架实现3倍无损加速超长文本生成,支持DeepSeek-R1和QwQ!

量子位
量子位 · 2025-03-12T04:36:31Z
人工智能周报 #302 - QwQ 32B,OpenAI禁令被拒,Alexa Plus

阿里巴巴推出了新AI模型QwQ 32B,参数达到320亿,性能接近671亿参数的DeepSeek-R1。该模型通过强化学习和外部反馈实现批判性思考,超越OpenAI的o1-mini。此外,阿里巴巴还发布了开源视频模型Wan 2.1,并计划在未来三年内投资520亿美元于云计算和AI领域。

人工智能周报 #302 - QwQ 32B,OpenAI禁令被拒,Alexa Plus

Last Week in AI
Last Week in AI · 2025-03-09T06:49:16Z

阿里云推出开源推理模型QwQ-32B,参数量为32B,性能超越OpenAI-o1-mini,接近DeepSeek-R1-671B。该模型降低了部署成本,支持消费级显卡,采用两阶段强化学习法提升逻辑推理能力,并集成Agent功能以增强自主性。

QwQ-32B 一键部署教程上线,性能比肩满血版 DeepSeek-R1

HyperAI超神经
HyperAI超神经 · 2025-03-07T10:38:56Z
全球首发:QwQ-32B本地一键部署、3090单卡可跑,共享算力成关键

阿里开源的QwQ-32B推理模型在个人设备上运行,性能接近DeepSeek-R1。尽管高性能模型部署难度大,「算了么」平台提供一键部署,普通用户可轻松体验。此外,该平台支持闲时算力共享,降低使用门槛,促进AI教育和算力生态发展。

全球首发:QwQ-32B本地一键部署、3090单卡可跑,共享算力成关键

机器之心
机器之心 · 2025-03-07T09:09:48Z
在Microsoft Word中本地使用QwQ-32B

Qwen新发布的开源LLM QwQ-32B在复杂推理方面表现优异,媲美DeepSeek-R1等大型模型,并可与Microsoft Word本地集成,免除月费。

在Microsoft Word中本地使用QwQ-32B

DEV Community
DEV Community · 2025-03-07T02:19:07Z
摩尔线程光速支持通义千问QwQ-32B开源模型

阿里云于3月6日开源推理模型QwQ-32B,摩尔线程迅速支持。QwQ-32B在多项基准测试中表现优异,超越OpenAI-o1-mini,推动AI技术发展,摩尔线程积极支持开发者进行AI创新。

摩尔线程光速支持通义千问QwQ-32B开源模型

实时互动网
实时互动网 · 2025-03-07T01:44:38Z
QwQ-32B与DeepSeek-R1-671B的比较

阿里云发布了Qwen系列LLM模型,其中QwQ-32B具备推理能力,采用基于结果的强化学习训练,并使用准确性验证器。用户可通过Hugging Face和DashScope API访问该模型,且在多个基准测试中表现优异。

QwQ-32B与DeepSeek-R1-671B的比较

DEV Community
DEV Community · 2025-03-06T05:43:29Z

阿里巴巴通义千问团队开源了QwQ-32B模型,参数320亿,性能接近6710亿参数的DeepSeek-R1。该模型通过强化学习提升推理能力,支持批判性思考,尤其在数学推理和代码编写方面表现优异,已在Apache 2.0许可证下开源。

阿里通义千问团队开源QwQ-32B模型 规模更小但性能媲美DeepSeek-R1-671B

蓝点网
蓝点网 · 2025-03-06T03:11:28Z
阿里半夜开源全新推理模型,QwQ-32B比肩DeepSeek-R1满血版

阿里开源了新推理模型QwQ-32B,参数量320亿,性能可与6710亿参数的DeepSeek-R1媲美。该模型通过强化学习提升数学和编程任务的表现,已在Hugging Face和ModelScope上发布。团队希望通过结合强化学习与基础模型,推动人工通用智能的发展。

阿里半夜开源全新推理模型,QwQ-32B比肩DeepSeek-R1满血版

机器之心
机器之心 · 2025-03-06T03:03:11Z
更小尺寸、更强性能,通义千问 QwQ-32B 推理模型开源!

阿里云发布并开源了推理模型千问QwQ-32B,其性能与DeepSeek-R1相当,支持在消费级显卡上本地部署。该模型通过大规模强化学习提升了数学和编程能力,适合高安全性应用。用户可免费下载体验,未来将探索智能体与强化学习的结合。

更小尺寸、更强性能,通义千问 QwQ-32B 推理模型开源!

实时互动网
实时互动网 · 2025-03-06T02:46:53Z
QwQ-32B: 领略强化学习之力

大规模强化学习显著提升了语言模型的性能。新模型QwQ-32B拥有320亿参数,性能与6710亿参数的DeepSeek-R1相当。通过冷启动数据和多阶段训练,QwQ-32B在数学和编程等任务上持续提升,展示了强化学习在预训练模型中的有效性。

QwQ-32B: 领略强化学习之力

Blog on Qwen
Blog on Qwen · 2025-03-05T16:00:04Z
<think>...</think> QwQ-Max-Preview

QwQ-Max-Preview是基于Qwen2.5-Max的预览版,具备深度推理、数学和编程能力。未来将开源,并推出APP和小型模型QwQ-32B,旨在提升用户体验和隐私保护,推动社区创新。

<think>...</think> QwQ-Max-Preview

Blog on Qwen
Blog on Qwen · 2025-02-24T18:00:04Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码