小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
从高拟真到真可用,LongCat-Video-Avatar 1.5 正式开源

美团开源了LongCat-Video-Avatar 1.5数字人视频模型,提升了唇形同步、稳定性和多人互动能力。通过优化音频特征提取和数据处理,该模型在复杂场景中表现优异,生成效率提高15倍,适用于电商直播和教学等多种场景,推动数字人视频的实际应用。

从高拟真到真可用,LongCat-Video-Avatar 1.5 正式开源

美团技术团队
美团技术团队 · 2026-05-25T00:00:00Z
从高拟真到真可用,LongCat-Video-Avatar 1.5 正式开源

美团龙猫LongCat发布了LongCat-Video-Avatar 1.5,提升了数字人视频模型的唇形同步、物理合理性和多人互动能力,支持复杂场景下的高质量内容输出,推理效率提升约15倍。团队希望通过开源推动数字人视频技术的发展。

从高拟真到真可用,LongCat-Video-Avatar 1.5 正式开源

实时互动网
实时互动网 · 2026-05-22T02:52:42Z
美团 LongCat 开源 General 365:树立推理评测新标尺

大模型在逻辑推理方面存在短板,尽管在专业知识测试中表现良好,但在日常场景的通用推理中准确率较低。美团LongCat团队发布的General 365基准测试揭示了当前模型的真实能力,强调推理能力与专业知识的解耦。测试结果显示,主流模型普遍未能达到及格线,反映出其在复杂逻辑任务中的不足。

美团 LongCat 开源 General 365:树立推理评测新标尺

美团技术团队
美团技术团队 · 2026-05-15T00:00:00Z
突破零样本 TTS 音色克隆上限:LongCat-AudioDiT 的声音克隆艺术

美团LongCat团队发布了LongCat-AudioDiT模型,采用全新的端到端文本转语音技术,减少信息损失。该模型在Seed基准测试中表现优异,取得最佳的说话人相似度和可懂度,证明了在波形潜空间生成语音的有效性。LongCat-AudioDiT以简化架构和高保真合成为目标,已开源,期待推动语音生成技术的发展。

突破零样本 TTS 音色克隆上限:LongCat-AudioDiT 的声音克隆艺术

美团技术团队
美团技术团队 · 2026-04-20T00:00:00Z
美团发布原生多模态 LongCat-Next:当视觉和语音成为AI的母语

LongCat团队提出了LongCat-Next模型,旨在统一处理图像、语音和文本等多模态信号。该模型通过离散Token实现理解与生成的协同,打破模态间的隔阂,表现出色。模型及其分词器已开源,期待推动多模态智能的发展。

美团发布原生多模态 LongCat-Next:当视觉和语音成为AI的母语

美团技术团队
美团技术团队 · 2026-04-02T00:00:00Z
美团发布原生多模态 LongCat-Next:当视觉和语音成为AI的母语

LongCat团队推出了新AI模型LongCat-Next,旨在统一处理图像、声音和文本等多模态信息。通过离散原生自回归架构DiNA和视觉分词器dNaViT,该模型实现了不同模态的统一建模,增强了理解与生成的协同能力。研究表明,离散化能更好地理解物理世界,且不损失信息。该模型已开源,欢迎开发者参与。

美团发布原生多模态 LongCat-Next:当视觉和语音成为AI的母语

实时互动网
实时互动网 · 2026-03-27T02:56:42Z
LongCat 为 OpenClaw 装上效率引擎:你的自动化任务还能再快 30%

OpenClaw 是一个开源的个人 AI 助手,能够将大语言模型的推理能力转化为实际操作。由于部分平台收紧对非官方入口的访问,账号安全风险增加。LongCat 团队提供了稳定的官方 API,帮助开发者构建自动化工作流。LongCat-Flash-Thinking-2601 在执行效率和任务完成质量上表现优异,能够快速响应复杂任务,提升开发者的工作效率。

LongCat 为 OpenClaw 装上效率引擎:你的自动化任务还能再快 30%

美团技术团队
美团技术团队 · 2026-03-09T00:00:00Z
多维创新打造强泛化智能体模型,LongCat-Flash-Thinking-2601技术报告发布

美团LongCat团队推出了开源模型LongCat-Flash-Thinking-2601,拥有5600亿参数,旨在解决智能体在复杂环境中的适应性问题。该模型通过环境扩展、强化学习和噪声训练,在多领域任务中表现出色,显著提升了泛化能力和决策稳定性。

多维创新打造强泛化智能体模型,LongCat-Flash-Thinking-2601技术报告发布

美团技术团队
美团技术团队 · 2026-02-02T00:00:00Z
美团 LongCat-Flash-Thinking-2601 发布,工具调用能力登顶开源 SOTA!

美团LongCat团队发布了LongCat-Flash-Thinking-2601模型,具备卓越的智能体搜索和工具调用能力,支持重思考模式,提升决策质量。该模型在编程和数学推理等评测中表现优异,已开源并可在线体验,旨在降低开发者使用门槛。

美团 LongCat-Flash-Thinking-2601 发布,工具调用能力登顶开源 SOTA!

美团技术团队
美团技术团队 · 2026-01-20T00:00:00Z

美团龙猫LongCat推出新稀疏注意力机制LoZA,解码速度提升10倍,支持处理1M长文本。通过优化模型结构,降低计算复杂度,提高效率,同时保持稳定性能。该技术在长文本任务中优于同类模型,未来将支持动态稀疏比例,以适应不同场景需求。

美团龙猫LongCat技术升级!新注意力机制解码速度快10倍,还能处理1M超长文本

量子位
量子位 · 2026-01-13T04:30:50Z
美团 LongCat-Video-Avatar 正式发布,实现开源 SOTA 级拟真表现

美团开源的LongCat-Video-Avatar模型在虚拟人视频生成方面取得显著进展,支持多任务生成,提升了动作拟真度和长视频稳定性,解决了身份一致性问题,广泛应用于影视和教育等领域。

美团 LongCat-Video-Avatar 正式发布,实现开源 SOTA 级拟真表现

美团技术团队
美团技术团队 · 2025-12-23T00:00:00Z
美团 LongCat-Video-Avatar 发布,实现开源SOTA级拟真表现

美团开源的LongCat-Video-Avatar模型在虚拟人视频生成方面取得显著进展,支持多任务生成,提升了动作拟真度和长视频稳定性,解决了身份一致性问题,广泛应用于影视娱乐等领域。

美团 LongCat-Video-Avatar 发布,实现开源SOTA级拟真表现

实时互动网
实时互动网 · 2025-12-18T09:35:30Z
LongCat 上线 AI 生图!精准高效,AI 创作不设限

美团推出的LongCat AI生图功能基于LongCat-Image模型,能够快速生成高质量图像并支持自然语言编辑,尤其擅长处理生僻字,已在LongCat APP和网站上线,旨在为用户提供高效的创作工具。

LongCat 上线 AI 生图!精准高效,AI 创作不设限

美团技术团队
美团技术团队 · 2025-12-09T00:00:00Z
美团发布 LongCat-Image 图像生成模型,编辑能力登顶开源 SOTA

美团 LongCat 团队发布了开源的 LongCat-Image 模型,旨在解决 AI 图像生成技术的开源与闭源问题。该模型拥有6B参数,兼具文生图和图像编辑能力,提升了指令遵循、图像质量和中文文字生成能力。在多个基准测试中表现优异,支持海报设计等应用,推动技术普惠与商业创作。

美团发布 LongCat-Image 图像生成模型,编辑能力登顶开源 SOTA

美团技术团队
美团技术团队 · 2025-12-09T00:00:00Z
美团发布 LongCat-Image 图像生成模型,编辑能力登顶开源SOTA

美团 LongCat 团队发布了开源的 LongCat-Image 模型,解决了 AI 图像生成技术的开源与闭源问题。该模型在图像编辑和中文文字生成方面表现优异,具有高性能和低门槛,支持多种商业应用,推动技术普惠。

美团发布 LongCat-Image 图像生成模型,编辑能力登顶开源SOTA

实时互动网
实时互动网 · 2025-12-08T02:14:02Z
R-HORIZON:探索长程推理边界,复旦NLP&美团LongCat联合提出LRMs能力评测新框架

大型推理模型(LRMs)在长链推理能力上面临挑战,现有评测体系无法有效评估其复杂任务表现。复旦大学与美团推出的R-HORIZON框架通过问题组合方法提升了模型的多步推理能力。评测显示,主流模型在长链推理中性能普遍下降,存在推理长度、反思机制和预算分配等瓶颈。通过强化学习训练,R-HORIZON显著提升了模型推理性能,标志着研究范式的转变。

R-HORIZON:探索长程推理边界,复旦NLP&美团LongCat联合提出LRMs能力评测新框架

美团技术团队
美团技术团队 · 2025-11-28T00:00:00Z
美团 LongCat 发布 AMO-Bench:突破 AIME 评测饱和困境,重新定义 LLM 数学上限

美团LongCat团队推出AMO-Bench,包含50道高难度原创数学推理题,旨在提升大模型的推理能力。目前顶尖模型在该评测中的表现仍未及格,显示出其在复杂推理任务上的局限性。AMO-Bench为行业提供了新的评测标准,未来将持续更新。

美团 LongCat 发布 AMO-Bench:突破 AIME 评测饱和困境,重新定义 LLM 数学上限

美团技术团队
美团技术团队 · 2025-11-27T00:00:00Z
美团开源视频生成模型LongCat-Video,兼具文生视频/图生视频/视频续写三大能力,媲美开闭源顶尖模型

美团开源的LongCat-Video视频生成模型通过统一架构处理多种视频生成任务,具备长视频生成能力和高效推理,在文生视频和图生视频任务中表现优异,标志着世界模型构建的重要进展。

美团开源视频生成模型LongCat-Video,兼具文生视频/图生视频/视频续写三大能力,媲美开闭源顶尖模型

HyperAI超神经
HyperAI超神经 · 2025-11-25T06:51:31Z
美团 LongCat Interaction 团队发布大模型交互系统技术报告 WOWService

在本地生活服务领域,大模型技术面临适配难、服务可靠性与个性化矛盾及高数据成本等问题。美团的WOWService系统通过数据与知识双驱动、自我优化训练和多Agent协同等技术,提升了服务质量和用户体验,显著降低了训练成本,推动了智能服务的升级。

美团 LongCat Interaction 团队发布大模型交互系统技术报告 WOWService

美团技术团队
美团技术团队 · 2025-11-21T00:00:00Z
美团 LongCat 团队发布全模态一站式评测基准 UNO-Bench

多模态人工智能正向全模态大模型发展,但评测体系滞后。美团LongCat团队提出UNO-Bench,提供高质量评测基准,有效评估模型的单模态与全模态能力,揭示“组合定律”,推动AI行业发展。

美团 LongCat 团队发布全模态一站式评测基准 UNO-Bench

美团技术团队
美团技术团队 · 2025-11-17T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码