小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Qwen2.5-32B和Qwen2.5-VL-32B是通义千问系列的两个大模型,分别为纯文本和多模态模型。部署前需确认硬件要求,建议使用Docker环境并安装NVIDIA工具包。模型支持中英文,具备强大推理能力,适用于图文问答和多模态推理。

vLLM 部署Qwen2.5 LLM & VLM 大模型

安志合的学习博客
安志合的学习博客 · 2026-01-05T13:16:14Z
Uni-MoE-2.0-Omni:基于开源Qwen2.5-7B的文本、图像、音频与视频理解全模态MoE模型

Uni-MoE-2.0-Omni是哈尔滨工业大学深圳分校研发的全模态大型模型,支持文本、图像、音频和视频的理解与生成。基于Qwen2.5-7B模型,采用动态容量路由和渐进式监督学习,显著提升了跨模态推理能力,尤其在视频理解和长语音处理方面表现优异。

Uni-MoE-2.0-Omni:基于开源Qwen2.5-7B的文本、图像、音频与视频理解全模态MoE模型

实时互动网
实时互动网 · 2025-11-19T02:32:18Z

文章讨论了Qwen3模型的架构与预训练过程,强调其在多语言和长上下文处理上的优势。Qwen3通过三个阶段的预训练提升语言能力,结合思维模式融合和强化学习,优化了推理能力和响应质量。

一文通透Qwen LLM系列——从Qwen、Qwen1.5、Qwen2、Qwen2.5到Qwen3(融合了chat和推理)、Qwen3 MoE

结构之法 算法之道
结构之法 算法之道 · 2025-08-16T07:00:02Z

Qwen2.5-Omni是一个多模态AI模型,支持文本、音频、图像和视频输入,能够生成自然语言的文本和语音响应。适用于实时语音和视频聊天、自然语音生成及复杂指令处理。文章介绍了如何在Python中设置和使用该模型,包括安装必要库和编写生成响应的函数。该模型具有7亿参数,首次运行可能较慢,但后续交互会更快。

Qwen2.5-Omni:强大的多模态AI模型使用指南与示例项目

KDnuggets
KDnuggets · 2025-05-16T12:43:24Z

本研究提出了一种通过单个训练示例进行验证奖励的强化学习方法(1-shot RLVR),显著提升了大型语言模型的数学推理能力,特别是将Qwen2.5-Math-1.5B在MATH500上的准确率从36.0%提高至73.6%。

使用单个训练示例的强化学习在大型语言模型中的推理能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-29T00:00:00Z
Qwen2.5 Omni:生成式人工智能与多模态的结合

在生成式人工智能时代,多模态模型Qwen2.5 Omni结合文本、图像、音频和视频,提升AI感知能力。其统一架构可实时处理多种输入,适用于医疗和电子商务等领域,推动行业变革。

Qwen2.5 Omni:生成式人工智能与多模态的结合

DEV Community
DEV Community · 2025-04-18T04:05:27Z
Spark-TTS是什么?基于 Qwen2.5 的下一代文本转语音系统

Spark-TTS是一种基于Qwen2.5大模型的先进文本到语音系统,支持中英文合成和零样本克隆。其特点包括高效流程、可控语音生成和双语支持。使用时需准备环境、安装依赖和下载模型,可通过命令行或Web UI进行合成。常见问题如依赖冲突和克隆效果不佳,已提供解决方案。

Spark-TTS是什么?基于 Qwen2.5 的下一代文本转语音系统

文武科技柜
文武科技柜 · 2025-03-27T09:27:17Z
Qwen2.5-Omni:迈向通用多模态AI的里程碑——解读首个支持实时多模态输入与输出的统一模型

Qwen2.5-Omni实现了多模态AI的端到端感知与生成,支持实时交互。其核心技术包括时间对齐的多模态位置编码、Thinker-Talker架构和流式处理,适用于语音对话和视频分析等场景,标志着向通用人工智能的进步。

Qwen2.5-Omni:迈向通用多模态AI的里程碑——解读首个支持实时多模态输入与输出的统一模型

我爱自然语言处理
我爱自然语言处理 · 2025-03-27T02:34:23Z
阿里深夜开源Qwen2.5-Omni,7B参数完成看、听、说、写

阿里通义千问团队于3月27日发布了Qwen2.5-Omni,这是一个支持文本、图像、音频和视频实时交互的多模态大模型。该模型开源,具备卓越的语音生成和多模态性能,适用于多种智能硬件,并在多项基准测试中表现优异。

阿里深夜开源Qwen2.5-Omni,7B参数完成看、听、说、写

机器之心
机器之心 · 2025-03-27T02:31:46Z
Qwen2.5 Omni: See, Hear, Talk, Write, Do It All!

Qwen2.5-Omni是一款新型多模态模型,支持文本、图像、音频和视频的实时交互,采用Thinker-Talker架构,具备优越的语音生成和指令执行能力,表现优于同类产品。目前已在多个平台上线,期待用户反馈与创新应用。

Qwen2.5 Omni: See, Hear, Talk, Write, Do It All!

Blog on Qwen
Blog on Qwen · 2025-03-26T16:00:45Z
阿里深夜开源Qwen2.5-VL新版本,视觉推理通杀,32B比72B更聪明

阿里通义千问团队发布了新模型Qwen2.5-VL-32B-Instruct,提升了人类偏好回复、数学推理和图像理解能力。与72B模型相比,32B在多模态任务中表现更佳,用户体验显著改善。团队将继续优化推理过程,以应对复杂视觉任务。

阿里深夜开源Qwen2.5-VL新版本,视觉推理通杀,32B比72B更聪明

机器之心
机器之心 · 2025-03-25T03:30:20Z

阿里发布了Qwen2.5-VL-32B-Instruct多模态模型,具备强大的视觉语言和数学推理能力,支持本地部署,已在Hugging Face上开源,用户可直接体验。

32B本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强

量子位
量子位 · 2025-03-25T01:18:46Z
Qwen2.5-VL-32B: 更聪明、更轻量!

Qwen2.5-VL-32B模型在社区中获得积极反馈,具备更符合人类偏好的回复、提升的数学推理能力和图像理解能力,尤其在多模态任务中表现优越。未来将专注于复杂推理任务的研究。

Qwen2.5-VL-32B: 更聪明、更轻量!

Blog on Qwen
Blog on Qwen · 2025-03-23T16:00:04Z
揭秘DeepSeek R1-Zero训练方式,GRPO还有极简改进方案

研究人员分析了DeepSeek-V3和Qwen2.5模型在强化学习中的表现,发现它们在预训练阶段已具备推理能力,并提出了无偏优化方法Dr. GRPO,以提高token效率并解决优化偏差。研究表明,模板对模型性能至关重要,强化学习显著提升了解题能力。

揭秘DeepSeek R1-Zero训练方式,GRPO还有极简改进方案

机器之心
机器之心 · 2025-03-22T13:04:18Z
360智脑开源Light-R1!1000美元数学上首次从零超越DeepSeek-R1-Distill

360智脑于2025年3月4日开源Light-R1-32B模型,训练成本约1000美元,使用7万条数学数据,AIME24得分76.6,超越DeepSeek-R1-Distill-Qwen-32B。该模型基于Qwen2.5-32B-Instruct,采用SFT+DPO课程学习,推动开源社区发展。

360智脑开源Light-R1!1000美元数学上首次从零超越DeepSeek-R1-Distill

机器之心
机器之心 · 2025-03-06T02:46:05Z
Qwen2.5-VL:强大的多模态大型语言模型 | 开源日报 No.524

math 是一个提供免费自学数学教育的项目,课程来自顶尖大学,建议每周学习18到22小时。telegram-tt 是轻量级的 Telegram Web 客户端,支持现代 Web API。Qwen2.5-VL 是阿里云开发的多模态语言模型,具备文档解析和视频理解能力。contribute-to-scroll 指导开发者为 Scroll 生态系统贡献。notesGPT 用于记录和转录语音笔记。

Qwen2.5-VL:强大的多模态大型语言模型 | 开源日报 No.524

开源服务指南
开源服务指南 · 2025-03-01T08:58:31Z
Qwen2.5-VL:阿里巴巴新一代多模态大模型的技术突破与应用前景

多模态大模型Qwen2.5-VL结合视觉与语言处理,具备动态分辨率和时间编码等创新,提升文档解析和智能代理能力。该模型在多项评测中表现优异,适合边缘计算和行业应用,推动AI向“行动智能”发展。

Qwen2.5-VL:阿里巴巴新一代多模态大模型的技术突破与应用前景

我爱自然语言处理
我爱自然语言处理 · 2025-02-21T02:18:46Z

阿里通义千问团队发布的Qwen多模态大模型具备视觉理解和生成能力,支持多语言。Qwen-VL结合视觉编码器和语言模型进行多任务训练,提升图像和视频处理能力。Qwen2-VL引入动态分辨率和多模态旋转位置嵌入,增强对不同分辨率和动态内容的理解。

一文通透Qwen多模态大模型:从Qwen-VL、Qwen2-VL到Qwen2.5-VL(含我司提问VLM项目的实现思路)

结构之法 算法之道
结构之法 算法之道 · 2025-02-11T13:55:19Z

阿里推出的Qwen2.5-Max模型在大模型竞技场中排名第七,超越DeepSeek-V3,尤其在编程和数学方面表现优异。用户反馈其稳定性强,代码生成简洁易读,显示出中国AI技术的快速进步。

杭州超越杭州:阿里Qwen2.5-Max反超DeepSeek-V3!网友:中国AI正在快速缩小差距

量子位
量子位 · 2025-02-04T12:37:51Z
LWiAI 播客第198期 - DeepSeek R1与Janus、Qwen2.5、OpenAI代理

在第198期节目中,讨论了上周的AI新闻:DeepSeek发布R1模型导致科技股下跌;OpenAI推出Operator面临竞争;特朗普撤销拜登的AI行政命令;台湾允许台积电海外生产2纳米芯片。

LWiAI 播客第198期 - DeepSeek R1与Janus、Qwen2.5、OpenAI代理

Last Week in AI
Last Week in AI · 2025-02-04T09:19:50Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码