小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

文章讨论了三种工程术语:提示工程、上下文工程和代理管理。提示工程关注与模型的交流方式;上下文工程强调提供模型所需的信息;代理管理涉及代理生命周期的资源调度。这三者解决不同层次的问题,混淆可能导致错误的解决方案。

代理工程的三种演变

Finisky Garden
Finisky Garden · 2026-04-08T16:19:33Z
超越批处理:Volcano演变为AI原生统一调度平台

随着大型语言模型的发展,Kubernetes成为智能系统的重要平台。新功能如Volcano v1.14、Kthena v0.3.0和AgentCube提升了资源调度效率,简化了大模型部署,并支持异构自动扩展,推动AI基础设施进步。

超越批处理:Volcano演变为AI原生统一调度平台

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-03-23T08:00:00Z
Kimi K2.5 带来了一个「蜂群时刻」

K2.5 更新引发热议,推出多模态模型和自主智能体集群,支持任务分解与资源调度。用户可体验免费功能,付费集群模式适用于特定计划。Kimi 高效处理文档和信息检索,展现强大并行能力。未来将优化调度、增强协作,拓展工具集成,推动 AI 发展。

Kimi K2.5 带来了一个「蜂群时刻」

爱范儿
爱范儿 · 2026-02-04T05:20:39Z
Kubernetes:充分利用动态资源分配

随着数据中心电力和硬件成本上升,组织们在Kubernetes上运行AI项目时寻求提高效率。Cloud Native Computing Foundation推出了Kubernetes调度器的增强功能DRA,允许用户更精确地分配资源,通过新的API提供设备属性,优化资源调度,提升GPU和CPU集群的性能。

Kubernetes:充分利用动态资源分配

The New Stack
The New Stack · 2025-12-23T14:00:44Z
Google ADK 深度探索(一):“一等公民”上下文 Context 解析

本文探讨了 Google ADK 的上下文机制及其在智能体开发中的重要性。上下文管理通过会话状态、数据传递和服务访问,解决了状态维护和资源调度问题。ADK 的设计提升了上下文管理效率,使智能体有效运行并保持状态记忆,同时提供简洁的开发接口。

Google ADK 深度探索(一):“一等公民”上下文 Context 解析

乱世浮生
乱世浮生 · 2025-12-14T14:05:52Z
您可能未充分利用您的GPU

Mithril的多云平台整合了GPU、CPU和存储,旨在解决GPU利用率低的问题。创始人Jared Quincy Davis指出,市场资源配置不当导致许多GPU未被有效利用,呼吁更灵活的资源调度和定价模型以提升效率。

您可能未充分利用您的GPU

Stack Overflow Blog
Stack Overflow Blog · 2025-11-25T08:40:00Z
基于 HAMi 的 GPU 虚拟化实践

本文探讨了在Kubernetes环境中使用HAMi实现GPU资源的虚拟化与调度,以满足小模型和大模型对显存与算力的隔离需求。HAMi通过智能调度和资源管理,提高了GPU的利用效率,解决了Nvidia现有方案的不足之处。

基于 HAMi 的 GPU 虚拟化实践

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-09-24T02:58:52Z
Kubernetes入门:针对GPU工作负载的动态资源分配(DRA)

动态资源分配(DRA)是Kubernetes的新特性,旨在提高GPU等专用硬件的管理效率。与传统设备插件架构相比,DRA支持动态资源分配、共享和细粒度配置,解决了资源利用不足的问题。通过新API对象如资源声明和设备类别,DRA优化了资源调度和管理,以适应现代工作负载需求。

Kubernetes入门:针对GPU工作负载的动态资源分配(DRA)

The New Stack
The New Stack · 2025-09-05T14:00:38Z
GAEA与DEPIN的关系

GAEA与DEPIN结合,实现去中心化AI与物理基础设施的深度融合,解决基础设施不足和资源调度不均的问题。GAEA整合物理资源,DEPIN提供基础设施支持,降低成本、提升资源利用率。通过智能合约,确保资源调度的公平性与透明性,增强网络可靠性与稳定性,保护数据隐私。

GAEA与DEPIN的关系

DEV Community
DEV Community · 2024-12-27T05:06:06Z

本文介绍了一种创新的云计算资源调度和管理方法,利用深度学习和遗传算法等优化技术提高系统性能和效率,取得了新的突破和进展。

StraightLine:一种面向机器学习应用请求的端到端资源感知调度器

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-25T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码