小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
人工智能系统学习保持仓库机器人交通顺畅

麻省理工学院与Symbotic的研究人员开发了一种新方法,利用深度强化学习协调仓库机器人,避免拥堵并提升效率。该系统实时调整优先级,实现25%的吞吐量提升,适应不同环境,未来计划扩展至更大仓库。

人工智能系统学习保持仓库机器人交通顺畅

MIT News - Artificial intelligence
MIT News - Artificial intelligence · 2026-03-26T04:00:00Z
DigitalOcean的Agentic推理云如何通过NVIDIA GPU为Workato实现67%的推理成本降低

Workato的AI研究实验室与DigitalOcean合作,利用NVIDIA Dynamo和vLLM优化推理性能。通过引入KV感知路由,显著提高了GPU的吞吐量和响应速度,分别提升67%和降低79%的延迟,从而降低了推理成本和所需GPU数量。

DigitalOcean的Agentic推理云如何通过NVIDIA GPU为Workato实现67%的推理成本降低

The DigitalOcean Blog
The DigitalOcean Blog · 2026-03-03T04:55:00Z

浙大与上海AI Lab提出的邻近自回归建模(NAR)通过“下一个邻域预测”显著提升了视觉生成的效率和质量。NAR模型在多个任务中实现了13.8倍的吞吐量提升,减少了生成步骤,特别在高分辨率图像和视频生成中表现出优势。

13.8倍吞吐提升!浙大上海AI Lab等提出视觉生成新范式,从“下一个token”到“下一个邻域”

量子位
量子位 · 2025-03-30T02:55:59Z

本文提出了SqueezeAttention方法,通过动态优化关键值缓存,显著减少大型语言模型的内存占用(高达70%)并提升吞吐量(最高2.2倍)。该方法结合多种稀疏化算法,保持了与原始模型相当的性能,适用于资源受限环境。研究还探讨了无损压缩技术和自适应KV缓存,以进一步提高推理效率和性能。

基于 L2 范数的高效 KV 缓存压缩策略

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-17T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码