小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
面向电商直播场景的全模态大模型推理加速方案

本文介绍了电商直播场景下的全模态理解大模型TLiveOmni在vLLM框架下的推理部署与量化优化。通过自定义插件和修复多模态Token排布,解决了vLLM对Omni模型支持不足的问题。采用SmoothQuant与GPTQ的复合量化方案,构建了5000条高质量数据的校准集,确保模型效果。最终在H20与RTX 4090上测试,推理加速达2.5至3.5倍,精度损失控制在1.5%以内。

面向电商直播场景的全模态大模型推理加速方案

实时互动网
实时互动网 · 2026-04-29T10:39:31Z
兄弟(中国)携核心产品矩阵及场景化解决方案参加成都教育展

兄弟(中国)在成都教育展展示了其核心产品和解决方案,涵盖智慧教学、学生兴趣培养和校园管理,旨在提升教育质量和管理效率。

兄弟(中国)携核心产品矩阵及场景化解决方案参加成都教育展

全球TMT-美通国际
全球TMT-美通国际 · 2026-04-28T06:58:32Z
3个月手搓Gamma架构,这个团队打造出了场景白盒化推理的“下一代内容OS”

AI内容创作正从生成模式转向任务执行模式,Pi系统通过结合AI生成与用户编辑,实现内容创作的可编辑化和系统化,提升协作效率,支持多种格式导出,推动内容生产向白盒化发展。Pi已获得广泛用户认可,标志着AI创作进入新阶段。

3个月手搓Gamma架构,这个团队打造出了场景白盒化推理的“下一代内容OS”

量子位
量子位 · 2026-04-28T02:15:27Z
腾讯智慧出行:单纯大模型上车无意义,要落地场景智能体

腾讯云智慧出行在北京车展前夕提出,车载智能体将提升用户体验,处理点餐、停车等任务。舱驾一体化趋势明显,腾讯将通过开放平台与生态合作,增强个性化服务。安全性是核心关注,智能体需在确保行车安全的前提下执行任务,未来将更好理解用户需求,推动汽车智能化进程。

腾讯智慧出行:单纯大模型上车无意义,要落地场景智能体

量子位
量子位 · 2026-04-28T01:40:48Z
从流行趋势研判到面料企划生成,打造纺织 AI 场景化落地样板间

大模型技术正在推动传统纺织行业的数字化转型。4月24日,上海举行了纺织AI智能体应用活动,汇聚了多家纺织企业的技术精英。活动旨在探索AI在纺织行业的应用,通过实战工作坊,参与者学习搭建AI智能体工作流,展示AI在设计、研发和市场营销中的实际应用,提升了纺织企业的生产力和创新能力。

从流行趋势研判到面料企划生成,打造纺织 AI 场景化落地样板间

百度大脑
百度大脑 · 2026-04-27T11:11:50Z
OpenClaw一键换上DeepSeek V4 Flash三大真香场景:开会摸鱼神器来了

OpenClaw更新了默认模型为DeepSeek V4 Flash,提升了工作效率。新功能包括自动生成会议纪要、实时语音查询和浏览器自动化,显著减少用户操作时间和精力,整体性能提升,适合日常使用。

OpenClaw一键换上DeepSeek V4 Flash三大真香场景:开会摸鱼神器来了

极道
极道 · 2026-04-27T02:52:00Z
Ollama launch用法详解:Claude Code、Codex、Hermes Agent、OpenClaw、VS Code等主流工具集成一步到位,本地AI大模型多场景复用

本文介绍了Ollama的命令及其与Codex、Claude Code、Hermes Agent、OpenClaw和VS Code等工具的集成。Ollama v0.15+引入的“ollama launch”命令简化了本地模型的配置与启动,用户可通过一条命令实现多种工具的无缝衔接,提升编码效率。

Ollama launch用法详解:Claude Code、Codex、Hermes Agent、OpenClaw、VS Code等主流工具集成一步到位,本地AI大模型多场景复用

人言兑
人言兑 · 2026-04-26T09:42:31Z
你不知道的 AI Coding:非技术人的上手、场景与实战

这篇文章介绍了如何让非技术人员使用 AI 编程工具 Claude Code。作者指出,掌握基本概念可以提高使用效率,通过明确需求和项目背景,用户能够更好地与 Claude Code 协作,完成数据处理和文档整理等任务。文章还提供了注册和订阅建议,以及利用 AI 工具提高工作效率的具体方法。

你不知道的 AI Coding:非技术人的上手、场景与实战

Tw93 的博客
Tw93 的博客 · 2026-04-26T00:00:00Z
国产大模型(GLM 5.1、Kimi K2.6)真实场景效果和 Coding Plan 额度测试

国产大模型GLM 5.1和Kimi K2.6在实际应用中表现良好,性价比高。它们在自动阅读文档、修复仪表盘错误和分析调用量等任务中表现出色,尤其是Kimi K2.6在速度上领先。GLM 5.1适合完成简单编码任务。

国产大模型(GLM 5.1、Kimi K2.6)真实场景效果和 Coding Plan 额度测试

I'm OWenT
I'm OWenT · 2026-04-22T22:45:45Z

随着AI在医疗领域的应用,高质量数据集成为提升模型性能的核心。医学影像、临床数据和生物信息学等多模态数据的快速增长,推动AI从图像识别向辅助诊疗发展。本文介绍了10个涵盖不同疾病和研究方向的医疗数据集,强调标准化数据和跨模态数据融合的重要性,为医疗AI的发展提供了基础和方向。

数据集汇总丨从医疗影像/临床数据,到细胞图谱/医学问答,10大数据集覆盖多类疾病场景

HyperAI超神经
HyperAI超神经 · 2026-04-22T06:18:42Z
推测解码:工作原理、应用场景及其在推理架构中的位置

本文讨论了推测解码在大语言模型推理中的应用,旨在加速请求而不影响输出。通过使用小型草稿模型生成多个候选令牌,主模型可以快速验证这些候选,从而提高生成速度。不同变体如EAGLE-3和SuffixDecoding针对不同限制进行了优化,显著提升了速度。推测解码与语义缓存相辅相成,有效降低请求延迟。选择合适的技术与工作负载匹配是实现最佳性能的关键。

推测解码:工作原理、应用场景及其在推理架构中的位置

Redis Blog
Redis Blog · 2026-04-22T00:00:00Z

华为于4月20日在广州发布了Pura系列及全场景新品,包括HUAWEI Pura 90系列、Pura X Max及可穿戴设备。Pura 90系列支持IP68防水,搭载麒麟9030S处理器,电池容量6000mAh,售价从4699元到8499元不等。Pura X Max为首款大阔折手机,售价10999元起。此外,华为还发布了AI眼镜、WATCH系列及MateBook 14等新产品,展示了其在智能设备领域的创新。

派早报:华为举办 Pura 系列及全场景新品发布会等

少数派
少数派 · 2026-04-21T00:20:19Z

绿盟科技推出的虚拟汽车靶场解决了智能网联汽车教学与竞赛中的高成本和并发问题。该平台支持高仿真度的汽车模拟,满足教学、竞赛和产品测试需求,支持多人在线,提升学习效果,确保公平性和实战能力,推动车联网安全发展。

能力升级!绿盟虚拟汽车靶场:清晰易懂,适配高校教学场景

绿盟科技技术博客
绿盟科技技术博客 · 2026-04-20T09:11:56Z
Vizrt AI Keyer 可消除 XR 和 VR 场景中的绿幕抠像

Vizrt推出了AI原生视觉叙事平台Vizrt AI Keyer,旨在提升虚拟现实和扩展现实应用。该平台通过识别人体形状,无需绿幕和复杂灯光设置,允许演员在虚拟场景中自由移动,增强观众互动和赞助机会,降低了XR环境的创建门槛。

Vizrt AI Keyer 可消除 XR 和 VR 场景中的绿幕抠像

实时互动网
实时互动网 · 2026-04-20T03:23:46Z
信华信携创新技术与场景化应用成果参加InnoEX 2026

信华信技术国际有限公司在2026香港国际创科展上展示了其在通用智能、金融健康、社会公共及产业房地产等领域的创新技术,特别是基于生成式AI的应用,旨在提升管理和运营效率,满足政府公共管理需求,并增强生产管理和基础设施管理的智能化能力。

信华信携创新技术与场景化应用成果参加InnoEX 2026

全球TMT-美通国际
全球TMT-美通国际 · 2026-04-15T06:10:51Z
新Vidu Q3参考生,这是冲着「剧」来的!万物皆可参考:特效音效场景都备好了

Vidu Q3是一款新发布的AI视频工具,专注于影视内容创作。它通过少量素材和描述生成高质量视频,具备强大的特效和音效能力,适用于多种场景。Vidu Q3的可复用建模解决了风格不一致和细节失控的问题,降低了创作成本,提高了效率,适合个人创作者和专业团队使用。

新Vidu Q3参考生,这是冲着「剧」来的!万物皆可参考:特效音效场景都备好了

量子位
量子位 · 2026-04-15T05:06:17Z

Topia推出Horizon,这是首个专为全球人才流动设计的智能体AI平台。Horizon能够管理员工流动,嵌入AI智能体,自动执行任务并提供建议,深度集成现有工具,确保合规且无数据保留。

Topia推出首个专为全球人才流动场景打造的智能体AI平台

全球TMT-美通国际
全球TMT-美通国际 · 2026-04-14T01:53:05Z
Reddit用户分享87个OpenClaw实战场景案例指南

Reddit用户分享了87个OpenClaw的实战案例,展示AI如何逐步融入个人数字生活,完成复杂任务。用户从基础操作开始,让AI控制电脑和远程服务器,进行文件传输、数据可视化和系统管理等,提升工作效率。AI的应用范围包括自动化报税、远程控制和任务管理,简化日常操作。用户强调从简单开始,逐步增加复杂度,鼓励多尝试和实验。

Reddit用户分享87个OpenClaw实战场景案例指南

极道
极道 · 2026-04-13T04:04:00Z

某票务平台在演唱会开票时遭遇数据库瓶颈,导致70%用户无法购票。传统架构无法应对高并发,空间架构(SBA)通过将数据存储在内存中,消除数据库瓶颈,提升系统扩展性。文章分析了SBA的理论基础、核心组件及其在极端并发场景下的应用,强调其适用于高并发、延迟敏感的系统,但也指出其复杂性和内存成本等局限。

【系统架构设计百科】空间架构:极端扩展场景的解法

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-13T00:00:00Z
数据复制解析:类型、示例与应用场景

数据复制是确保多个位置数据一致性的过程,分为同步和异步两种方式。同步复制适用于低延迟环境,异步复制适合跨区域部署。数据复制提高了应用性能和可靠性,支持灾难恢复和快速服务恢复。Active-Active地理分布模型允许每个节点同时处理读写,适合全球用户。

数据复制解析:类型、示例与应用场景

Redis Blog
Redis Blog · 2026-04-13T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码