小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
AI Agent 如何为企业上云按下”加速键” —— CRM系统迁移实战

本文探讨了AI Agent在企业云迁移中的应用,以IDC三层CRM系统迁移至亚马逊云为例。与传统手动迁移相比,AI Agent辅助迁移将迁移时间从218分钟缩短至55分钟,人工介入时间减少至15分钟。AI Agent通过自动化命令和模板生成,提高了迁移效率,减少了人为错误,使工程师能够专注于更高价值的决策工作。

AI Agent 如何为企业上云按下”加速键” —— CRM系统迁移实战

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-04-30T08:59:46Z
面向电商直播场景的全模态大模型推理加速方案

本文介绍了电商直播场景下的全模态理解大模型TLiveOmni在vLLM框架下的推理部署与量化优化。通过自定义插件和修复多模态Token排布,解决了vLLM对Omni模型支持不足的问题。采用SmoothQuant与GPTQ的复合量化方案,构建了5000条高质量数据的校准集,确保模型效果。最终在H20与RTX 4090上测试,推理加速达2.5至3.5倍,精度损失控制在1.5%以内。

面向电商直播场景的全模态大模型推理加速方案

实时互动网
实时互动网 · 2026-04-29T10:39:31Z
德勤优化EKS环境配置,使用Amazon EKS和vCluster实现89%的测试环境加速

德勤通过使用Amazon EKS和vCluster,将环境配置时间从45分钟缩短至5分钟,提升了89%的效率,年节省约500小时。这一方案降低了基础设施成本,优化了资源管理,使QA团队能够独立快速创建测试环境,显著提高了开发效率。

德勤优化EKS环境配置,使用Amazon EKS和vCluster实现89%的测试环境加速

AWS Architecture Blog
AWS Architecture Blog · 2026-04-27T17:47:34Z
FFmpeg 推出基于 Vulkan 加速的 360 度视频转换功能

FFmpeg 利用 Vulkan 实现了高效的 360 度视频转换,支持多种格式和投影效果,效率超过 CPU 转换。

FFmpeg 推出基于 Vulkan 加速的 360 度视频转换功能

实时互动网
实时互动网 · 2026-04-10T01:53:04Z

Google 的 Swiss Table 是一种高效的哈希表实现,利用 SIMD 指令实现 16 路并行探测,性能比传统的 std::unordered_map 快 2 倍以上。它通过控制字节优化内存访问,减少缓存未命中率,提升查找效率,并采用开放寻址策略,解决了链式哈希的内存开销和性能瓶颈问题。

Swiss Table:Google 的 SIMD 加速哈希表

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2026-04-07T00:00:00Z

2026年3月28日,AI技术迅速发展。Google发布了实时多模态语音模型Gemini 3.1 Flash Live,SUSE和Nebius推出了AI原生基础设施,Check Point发布了安全蓝图,合规工具逐渐内嵌设计。

AI Infra Brief|实时模型与 AI 原生基础设施加速(2026.03.28)

dotNET跨平台
dotNET跨平台 · 2026-04-04T00:03:58Z

短剧比想象中更短命。作为一个依靠「强刺激」迅速催熟的内容形态,它尚未完成从野蛮生长到成熟工业化的过渡,核心盈利模型就已率先失效。在供给端,不断攀升的制作成本导致真人短剧行业的亏损率已超过 90%;在消费端,高度同质化的猎奇套路也让观众产生了严重的审美疲劳。但真正把旧模式推向临界点的,是底层技术的骤变。AI...

AI加速,短剧比想象中更短命

TechWeb 全站精华
TechWeb 全站精华 · 2026-04-01T02:58:50Z

HagiCode Desktop 采用混合分发架构,通过 P2P 加速大文件下载,同时保留 HTTP 回源,优化下载速度,解决了传统 HTTP 下载的带宽限制和断点续传问题,适用于大于 100MB 的文件,设计清晰,用户可控,提升用户体验。

HagiCode Desktop 混合分发架构解析:如何用 P2P 加速大文件下载

dotNET跨平台
dotNET跨平台 · 2026-03-28T00:12:35Z

在第一篇文章《基于流式幂迭代的Muon实现:1. 初识》中,笔者将流式幂迭代(Streaming Power Iteration)单独抽象出来,作为一种新的Muon实现方式。由于新方案是直接对S...

基于流式幂迭代的Muon实现:2. 加速

科学空间|Scientific Spaces
科学空间|Scientific Spaces · 2026-03-26T05:14:00Z
超越视觉:NVIDIA RTX加速计算机现已直接连接Apple Vision Pro

越来越多的合作伙伴利用CloudXR和visionOS优化工作流程。软件供应商如Autodesk和Innoactive将高保真应用原生交付给Apple Vision Pro,助力企业和汽车行业实现高质量3D资产和复杂模拟的可视化。

超越视觉:NVIDIA RTX加速计算机现已直接连接Apple Vision Pro

NVIDIA Blog
NVIDIA Blog · 2026-03-17T17:00:58Z
FFmpeg 8.1 发布,新增实验性 xHE-AAC MPS212 音频加速功能,以及更多 Vulkan 加速选项

FFmpeg 8.1将于2026年3月16日发布,新增xHE-AAC解码、JPEG-XS支持和Vulkan编解码器,提升多媒体处理能力并修复错误。

FFmpeg 8.1 发布,新增实验性 xHE-AAC MPS212 音频加速功能,以及更多 Vulkan 加速选项

实时互动网
实时互动网 · 2026-03-17T01:55:14Z
AReaL x 昇腾,加速大模型全异步RL训练创新

AReaL框架通过全异步强化学习训练,简化大模型开发,提升训练效率和系统可靠性。其核心优势在于解耦式Agentic RL和Single Controller架构,支持在昇腾平台高效运行,优化权重更新和显存使用,帮助开发者快速上手。

AReaL x 昇腾,加速大模型全异步RL训练创新

华为云官方博客
华为云官方博客 · 2026-03-09T07:17:30Z

2026年3月6日,AI基础设施迎来多项合作:AMD与Meta签署1000亿美元算力协议,推理成本降低86%;CoreWeave部署NVIDIA GB200集群;Together AI发布多项优化工具;红帽与Telenor在挪威建设主权AI工厂,显示出AI领域的快速发展与合作趋势。

AI Infra Brief|千亿级合作与推理加速(2026.03.06)

dotNET跨平台
dotNET跨平台 · 2026-03-07T00:01:23Z
《AI纪录片》是一部过度渲染的宣传作品,既迎合了末日主义者,也吸引了加速主义者。

《AI纪录片:或我如何成为末日乐观主义者》探讨了生成性人工智能的影响。导演罗赫与专家对话,呈现了悲观与乐观的观点,但缺乏深入分析,未能有效利用访谈资源,整体内容显得肤浅,未能满足公众对AI技术的深度理解需求。

《AI纪录片》是一部过度渲染的宣传作品,既迎合了末日主义者,也吸引了加速主义者。

The Verge
The Verge · 2026-03-06T19:05:00Z
又快又省?仅5%参数、训练快4倍!ArcFlow用「非线性」魔法实现FLUX/Qwen推理40倍加速

抱歉,您提供的文本内容过于简短,无法进行有效的总结。请提供更详细的文章内容。

又快又省?仅5%参数、训练快4倍!ArcFlow用「非线性」魔法实现FLUX/Qwen推理40倍加速

机器之心
机器之心 · 2026-02-24T09:43:12Z

黑客发现MacBook内置加速度计和陀螺仪接口,能够实时读取三轴加速度和角速度数据。这一发现引发网友担忧,可能影响AppleCare赔偿。M3 Pro已确认存在此传感器,但苹果尚未公开其用途。

黑客挖出苹果隐藏硬件!你的MacBook里有加速计/陀螺仪,摔没摔过售后都知道

量子位
量子位 · 2026-02-24T06:30:33Z
视频生成推理加速实践:基于 torch.compile 的整图编译优化

视频生成模型的推理优化应从算子级转向计算图级,以提升整体执行效率。Self-Forcing模型采用逐块生成策略,降低计算复杂度。通过torch.compile实现整图编译,消除Graph Break,最终实现约47.6%的加速效果。

视频生成推理加速实践:基于 torch.compile 的整图编译优化

实时互动网
实时互动网 · 2026-01-28T07:51:08Z
CNCF Dragonfly通过P2P加速容器和模型共享

Dragonfly项目是一个开源的点对点图像和文件分发系统,已从云原生计算基金会的孵化项目毕业。自2018年起,该技术在生产环境中表现良好,支持Kubernetes,广泛应用于大规模AI工作负载和边缘计算。通过P2P机制加速容器镜像分发,显著提高了效率。

CNCF Dragonfly通过P2P加速容器和模型共享

The New Stack
The New Stack · 2026-01-16T14:15:19Z
摩尔线程开源MUSA加速版MONAI 1.5.0,国产全功能GPU赋能AI医学影像

摩尔线程开源MUSA加速版MONAI 1.5.0,专注于AI医学影像,提升国产算力。MONAI框架连接学术与临床,已下载350万次。MUSA软件栈优化性能,推动医学AI应用与国产生态发展。

摩尔线程开源MUSA加速版MONAI 1.5.0,国产全功能GPU赋能AI医学影像

实时互动网
实时互动网 · 2026-01-16T10:17:28Z
Spice.ai - 一个开源加速引擎,专为时间序列和数据驱动的人工智能设计,提供…

Spice.ai是一个开源加速引擎,专为时间序列和结构化数据设计,支持低延迟在线推理,适用于实时监控和预测维护等应用,提供快速SQL查询、全文搜索和LLM集成。

Spice.ai - 一个开源加速引擎,专为时间序列和数据驱动的人工智能设计,提供…

云原生
云原生 · 2026-01-11T12:48:49Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码