小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
面向电商直播场景的全模态大模型推理加速方案

本文介绍了电商直播场景下的全模态理解大模型TLiveOmni在vLLM框架下的推理部署与量化优化。通过自定义插件和修复多模态Token排布,解决了vLLM对Omni模型支持不足的问题。采用SmoothQuant与GPTQ的复合量化方案,构建了5000条高质量数据的校准集,确保模型效果。最终在H20与RTX 4090上测试,推理加速达2.5至3.5倍,精度损失控制在1.5%以内。

面向电商直播场景的全模态大模型推理加速方案

实时互动网
实时互动网 · 2026-04-29T10:39:31Z
戴盟机器人发布全模态物理世界数据集Daimon-Infinity

戴盟机器人发布了全球最大规模的全模态物理世界数据集Daimon-Infinity,涵盖触觉、视觉等多维信息,计划形成数百万小时的数据。该数据集将用于真实场景的物理交互,推动具身智能的发展,并已开源10000小时高质量数据,构建了外发式数据采集网络,形成完整的数据处理闭环。

戴盟机器人发布全模态物理世界数据集Daimon-Infinity

全球TMT-美通国际
全球TMT-美通国际 · 2026-04-21T08:33:07Z
智象未来完成新一轮融资,全力打造下一代原生全模态世界模型

智象未来(HiDream.ai)近日完成超5亿元融资,资金将用于研发下一代全模态世界模型及市场拓展。公司在多模态生成式AI领域表现突出,已覆盖3000万用户和4万企业客户,推出多款创新产品,推动AI技术商业化。

智象未来完成新一轮融资,全力打造下一代原生全模态世界模型

量子位
量子位 · 2026-04-16T06:40:06Z
小米MiMo大模型首次推出Token Plan,单次订阅可满足全模态Agent任务需求

小米推出MiMo大模型的Token Plan,提供四种订阅方案,满足不同开发者需求。该计划透明计费,支持灵活调用多种模型,无使用时间限制,提升用户体验。

小米MiMo大模型首次推出Token Plan,单次订阅可满足全模态Agent任务需求

量子位
量子位 · 2026-04-03T05:44:33Z
国产玩家亮剑世界模型!把全模态卷到顶后,天工AI不藏了

天工AI在中关村论坛发布了三款多模态模型Matrix-Game 3.0、SkyReels V4和Mureka V9,标志着其向AI平台经济的迈进。这些模型在游戏、视频和音乐领域实现了实时交互和高质量生成,构建了可交互的世界模型。天工AI的“3+1战略”旨在整合这些能力,推动AI内容的规模化生产。

国产玩家亮剑世界模型!把全模态卷到顶后,天工AI不藏了

量子位
量子位 · 2026-03-27T14:08:24Z
从Token到词元:全模态时代的基模与交互入口

国家数据局首次确认“词元”为Token的标准译名,标志着AI技术向全模态发展。模思智能通过语音切入,推动统一Token结构,提升情境理解能力,已成为国内领先的全模态模型公司。

从Token到词元:全模态时代的基模与交互入口

量子位
量子位 · 2026-03-27T04:11:18Z
模态窗口与新页面:用户体验决策树

在用户体验设计中,选择模态窗口或新页面非常重要。模态窗口适合独立任务,有助于用户保持上下文,但可能造成干扰;新页面则适合复杂的多步骤工作流程。设计时应优先考虑非阻塞对话框,以提高用户效率。

模态窗口与新页面:用户体验决策树

Articles on Smashing Magazine — For Web Designers And Developers
Articles on Smashing Magazine — For Web Designers And Developers · 2026-03-19T15:00:00Z
EMBridge:通过跨模态表示学习提升肌电信号的手势泛化能力

EMBridge是一个跨模态表示学习框架,旨在通过将表面肌电信号(sEMG)与高质量结构化数据对齐,提升手势识别的准确性。该框架采用查询变换器和对比学习目标,实现了零样本手势分类,展示了在可穿戴设备上进行手势识别的潜力。

EMBridge:通过跨模态表示学习提升肌电信号的手势泛化能力

Apple Machine Learning Research
Apple Machine Learning Research · 2026-03-03T00:00:00Z
AI工具尝鲜:从"模态爆发"到"生态耕耘"

字节跳动的SeedDance引发关注,AI商业化应用迎来爆发。对话助手转变为知识调度引擎,竞争加剧。模型编排成为趋势,开发者可根据任务选择合适模型。图像生成和音频技术不断进步,开源社区仍是创新源泉。视频生成技术提升,AI应用潜力巨大。

AI工具尝鲜:从"模态爆发"到"生态耕耘"

Sekyoro的博客小屋
Sekyoro的博客小屋 · 2026-02-11T13:22:06Z

面壁智能推出的全模态模型MiniCPM-o4.5,具备边看边听和主动应答能力,能够实时识别环境变化并进行对话。与传统AI不同,它支持全双工交互,提升了用户体验,适用于多种场景,标志着端侧AI的新发展方向。

面壁智能开源全模态模型MiniCPM-o4.5,边看边听还能主动抢答

量子位
量子位 · 2026-02-05T15:19:59Z
“2.4万亿+原生全模态”是怎样炼成的?文心5.0技术报告首公开

PaddleFormers将降低多模态模型的训练和应用门槛,帮助开发者提升业务能力,推动多模态模型在更多场景中的应用。

“2.4万亿+原生全模态”是怎样炼成的?文心5.0技术报告首公开

百度大脑
百度大脑 · 2026-02-05T12:40:45Z
AlphaGenome登Nature封面!1秒内完成所有模态和细胞类型的变异效应预测

谷歌DeepMind推出的AlphaGenome模型能够高效预测DNA序列中基因变异的影响,支持多种生物过程。该模型以百万碱基对的序列为输入,能在一秒内评估变异影响,表现出色,推动疾病机制研究和合成生物学的发展。

AlphaGenome登Nature封面!1秒内完成所有模态和细胞类型的变异效应预测

HyperAI超神经
HyperAI超神经 · 2026-01-29T03:02:12Z
武汉人工智能研究院 x Gitee:跨模态智能研发的革新之路

武汉人工智能研究院专注于跨模态智能技术,面临数据管理、安全、团队协作和模型训练等挑战。通过引入Gitee企业版,提升研发效率,确保数据安全,加速技术产业化,推动原创技术落地。

武汉人工智能研究院 x Gitee:跨模态智能研发的革新之路

Gitee 官方博客
Gitee 官方博客 · 2026-01-22T09:41:48Z
AI 真能看懂物理世界吗?FysicsWorld:填补全模态交互与物理感知评测的空白

抱歉,您提供的文本内容过于简短,无法进行有效总结。请提供更详细的文章内容。

AI 真能看懂物理世界吗?FysicsWorld:填补全模态交互与物理感知评测的空白

机器之心
机器之心 · 2025-12-28T10:03:00Z
BrainOmni:首个统一脑电磁基础模型,实现跨设备、跨模态的通用脑信号表征

AI Shortlist 是一篇关于人工智能的文章,探讨了其技术、应用及发展趋势,分析了AI在各领域的影响及未来潜力。

BrainOmni:首个统一脑电磁基础模型,实现跨设备、跨模态的通用脑信号表征

机器之心
机器之心 · 2025-12-11T06:52:57Z
宣布vLLM-Omni:轻松、快速且经济的全模态模型服务

vLLM-Omni是vLLM生态系统的重要扩展,支持全模态AI模型的文本、图像、音频和视频处理,优化内存管理,简化使用并提升性能,计划扩展模型支持以推动高效推理。

宣布vLLM-Omni:轻松、快速且经济的全模态模型服务

vLLM Blog
vLLM Blog · 2025-11-30T00:00:00Z
哈工大深圳团队推出Uni-MoE-2.0-Omni:全模态理解、推理及生成新SOTA

抱歉,提供的文本内容不足以进行总结。请提供更详细的文章内容。

哈工大深圳团队推出Uni-MoE-2.0-Omni:全模态理解、推理及生成新SOTA

机器之心
机器之心 · 2025-11-25T09:57:00Z

睿尔曼开源全球首个高质量多模态真机数据集,旨在解决机器人研发中的数据瓶颈,推动智能机器人算法创新。数据来源于真实场景,确保高保真度和稳定性,促进机器人技术发展,构建开放共享的生态系统。

睿尔曼开源全球首个高质量、模态数量最多的真机数据集

量子位
量子位 · 2025-11-24T11:15:34Z
Uni-MoE-2.0-Omni:基于开源Qwen2.5-7B的文本、图像、音频与视频理解全模态MoE模型

Uni-MoE-2.0-Omni是哈尔滨工业大学深圳分校研发的全模态大型模型,支持文本、图像、音频和视频的理解与生成。基于Qwen2.5-7B模型,采用动态容量路由和渐进式监督学习,显著提升了跨模态推理能力,尤其在视频理解和长语音处理方面表现优异。

Uni-MoE-2.0-Omni:基于开源Qwen2.5-7B的文本、图像、音频与视频理解全模态MoE模型

实时互动网
实时互动网 · 2025-11-19T02:32:18Z

文心5.0正式发布,支持文字、图像、音频和视频的全模态输入与输出,具备强大的理解与生成能力。其在多模态理解和情感分析方面表现突出,能够精准捕捉细节并进行复杂推理。新技术采用统一架构,提升训练与推理效率,参数规模超过2.4万亿,标志着百度在大模型领域的突破。

2.4万亿参数原生全模态,文心5.0一手实测来了

量子位
量子位 · 2025-11-13T09:39:15Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码