小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate

腾讯发布的HunyuanOCR模型是一款轻量级开源OCR视觉语言模型,具备高效的文本检测、识别和复杂文档解析能力。该模型采用端到端架构,结合原生ViT和轻量LLM,克服了传统模型的局限性,已在多个平台开源,推动科研与工业应用。

混元OCR模型核心技术揭秘:统一框架、真端到端

量子位
量子位 · 2025-11-30T02:36:16Z

腾讯混元数字人团队发布Moral RolePlay基准,揭秘大模型的「道德困境」

机器之心
机器之心 · 2025-11-22T11:02:34Z

刚刚!腾讯混元开源HunyuanVideo 1.5 元宝上线生视频能力

机器之心
机器之心 · 2025-11-21T04:27:00Z

腾讯混元图像3.0在全球文生图模型中排名第一,超越谷歌Nano Banana等闭源模型。该模型采用多模态架构,具备强大的语义理解和生成能力,支持多种输入输出形式,展现出卓越的技术实力。

刚刚,全球AI生图新王诞生!腾讯混元图像3.0登顶了

量子位
量子位 · 2025-10-05T06:49:46Z

腾讯发布的混元图像3.0是当前参数最多的开源生图模型,拥有80B参数,支持多分辨率图像生成,具备强大的指令遵从和文字渲染能力,效果媲美领先的闭源模型。

可能是目前效果最好的开源生图模型,混元生图3.0来了

量子位
量子位 · 2025-09-30T12:57:45Z

腾讯混元团队推出了首个高质量原生3D组件生成模型Hunyuan3D-Part,解决了现有3D生成方法的可控性和几何质量问题。该模型通过P3-SAM和X-Part实现高精度组件分割和生成,适用于视频游戏和3D打印等领域。

业界首个高质量原生3D组件生成模型来了!来自腾讯混元团队

量子位
量子位 · 2025-09-27T05:10:36Z

spring-ai-hunyuan项目已更新至1.0.0.2版本,新增思考链、语音识别(ASR)和语音合成(TTS)功能,提升文本生成场景的开发体验。项目源码已开源,集成简单,支持流式和阻塞式问答,适合数据驱动应用。

混元开源之力:spring-ai-hunyuan 项目功能升级与实战体验 - 努力的小雨

努力的小雨
努力的小雨 · 2025-09-18T01:18:00Z

腾讯混元团队推出的PromptEnhancer框架,通过思维链提示重写,提升AI绘画文本-图像对齐精度,准确率提高17%。该框架无需修改模型权重,适用于多种T2I模型,助力研究人员优化提示技术,并开源高质量基准测试数据集,推动AI绘画的可控性与创作效率。

腾讯混元开源AI绘画新框架:24维度对齐人类意图,让AI读懂复杂指令

量子位
量子位 · 2025-09-17T02:02:07Z

腾讯混元升级了AI绘画微调方法,通过Direct-Align和语义相对偏好优化(SRPO)显著提升了图像的真实感和美学评分,人工评估分数提高300%。新方法在32块H20上训练10分钟即可收敛,解决了传统模型的优化局限性,并支持在线调整奖励信号,生成图像质量显著提升。

腾讯混元升级AI绘画微调范式,在整个扩散轨迹上优化,人工评估分数提升300%

量子位
量子位 · 2025-09-15T06:39:40Z

腾讯开源的混元图像模型2.1支持2K高清生图,具备强大的生成效果和复杂语义理解能力,迅速成为Hugging Face全球第三热门,适用于多种视觉创作需求,助力设计师高效创作。

腾讯混元发布并开源图像模型2.1,支持原生2K生图

量子位
量子位 · 2025-09-10T08:53:50Z

全球机器翻译比赛拿下30个语种第1名,腾讯混元翻译模型开源

机器之心
机器之心 · 2025-09-02T01:54:15Z

手机也能跑,腾讯混元一口气开源4款小模型

机器之心
机器之心 · 2025-08-04T12:15:41Z

腾讯混元推出四款小尺寸开源模型,参数分别为0.5B、1.8B、4B和7B,适用于手机和低功耗设备。这些模型具备快速推理和高性价比,支持复杂任务处理,并已在多个应用中验证其实用性。模型的上下文窗口可处理超长内容,提升了多行业的应用潜力。

手机也能跑大模型,腾讯混元推出多款小尺寸开源模型

量子位
量子位 · 2025-08-04T08:12:39Z

腾讯混元团队提出的MixGRPO框架结合了SDE与ODE采样,显著提升了图像生成的效率和性能,训练时间减少近50%。MixGRPO-Flash进一步将训练时间降低71%,在多个维度上优于DanceGRPO,推动了图像生成技术的发展。

训练时间减半,性能不降反升!腾讯混元开源图像生成高效强化方案MixGRPO

量子位
量子位 · 2025-08-02T09:55:52Z

腾讯发布的混元3D世界模型1.0是首个支持物理仿真的开源3D生成系统,用户可通过文本或图像一键生成高质量可交互的3D场景,兼容主流3D建模软件,适用于虚拟现实和游戏开发等领域。

腾讯发布混元3D世界模型1.0:首个支持物理仿真的开源世界生成系统

量子位
量子位 · 2025-07-31T07:27:20Z

ICCV 2025 | 清华&腾讯混元X发现「视觉头」机制:仅5%注意力头负责多模态视觉理解

机器之心
机器之心 · 2025-07-14T12:19:34Z

腾讯推出首款开源混合推理模型Hunyuan-A13B,参数80B,激活参数13B,推理速度快且性价比高。该模型在长文理解和Agent工具调用方面表现优异,支持256K上下文窗口,适合个人开发者使用。同时,腾讯还开源了两个新数据集,以提升大语言模型的能力。

腾讯混元推出首款开源混合推理模型,擅长Agent工具调用和长文理解

量子位
量子位 · 2025-06-27T08:40:33Z

腾讯混元拥抱开源:混元3D模型下载量超160万,多尺寸模型全面开源

机器之心
机器之心 · 2025-05-21T07:10:17Z

腾讯推出混元图像2.0,实现边说边画的实时图像生成,响应速度达到毫秒级。用户可通过文字或手绘输入,系统即时生成图像。该模型具备更大参数和高效图像编解码器,提升了生成效果和真实感。

鹅厂放大招,混元图像2.0「边说边画」:描述完,图也生成好了

量子位
量子位 · 2025-05-16T06:13:16Z

腾讯挖走微软的WizardLM团队,核心成员来自北大,推出的新模型Hunyuan-Turbos已进入大模型前十。该团队曾因开源问题受挫,现加入腾讯后发展迅速。国内大厂人才竞争激烈,未来竞争将更加激烈。

腾讯混元挖走微软明星大模型团队!一作全员出走,新成果已跻身大模型竞技场TOP 10

量子位
量子位 · 2025-05-14T09:29:53Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码