小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
[MAF的Agent管道详解-03]连接LLM的IChatClient对象 - Artech

本文介绍了如何使用IChatClient对象与大型语言模型(LLM)进行交互。通过OpenAIClient和AzureOpenAIClient,可以创建IChatClient对象,并获取天气信息以提供穿搭建议。示例中,用户询问苏州天气,LLM根据天气生成了穿搭建议,强调面料选择和搭配技巧。

[MAF的Agent管道详解-03]连接LLM的IChatClient对象 - Artech

Artech
Artech · 2026-05-28T00:52:00Z
大规模可靠的LLM推理

在数据、应用和人工智能大会上,Databricks分享了构建可靠LLM推理基础设施的经验。为应对日益增长的推理需求,确保系统的可靠性和低延迟至关重要。通过动态路由和自动扩展技术,Databricks优化了资源利用,显著提升了处理能力和效率,并改进了多模态请求的处理,增强了系统整体性能。

大规模可靠的LLM推理

Databricks
Databricks · 2026-05-27T20:20:00Z

文章探讨了大语言模型(LLM)在写作中的应用及局限性。作者指出,模型的微调可能导致输出内容同质化,影响语言表达的多样性。使用LLM时,需提供丰富输入以避免低质量文本,并建议创作后进行自我审查,以保持个人风格。整体而言,LLM的使用需谨慎,以免依赖导致创作能力下降。

为什么没人会喜欢你用 LLM 写出来的东西?

少数派
少数派 · 2026-05-27T03:31:24Z

当前高端NVIDIA显卡及其服务器和电力成本高昂,尤其在运行大型模型时。苹果硬件和DGX Spark是可行的替代方案。Mac Studio M3 Ultra在处理速度上表现尚可,但未来本地推理的成本和内存短缺令人担忧。使用多台MacBook M5 Max进行分布式推理可能是一个有趣的方向,结合不同模型的优势可能提高性能。

在DwarfStar中分布式推理LLM

<antirez>
<antirez> · 2026-05-25T14:54:59Z

本文探讨了大型语言模型(LLM)的工作原理,类比于19世纪的差分机。LLM通过自回归机制动态生成输出,结合指令和数据。文章分析了RNN与Transformer的优缺点,强调Transformer在并行计算上的优势,并指出LLM在本质上是现代差分机,探讨了其在AI代理中的应用及记忆系统的重要性。

理解LLM的范式——它就是个差分机?

Est's Blog
Est's Blog · 2026-05-25T03:57:00Z
在Databricks上通过提示缓存加速开源模型的LLM推理

在旧金山举行的全球最大数据、应用和人工智能活动中,研究人员探讨了提示缓存技术在大型语言模型(LLM)推理中的应用。提示缓存可以消除重复请求的冗余,提高模型在特定领域的质量,并降低计算成本。Databricks为开源模型提供此功能,确保安全性并自动优化性能,提升推理效率。

在Databricks上通过提示缓存加速开源模型的LLM推理

Databricks
Databricks · 2026-05-22T20:00:00Z
协作AI功能的产品实验:基于Python的LLM工具中的集群随机化

在协作环境中,用户之间的相互影响会使传统的用户级A/B测试失效。文章探讨了通过集群随机化来解决这一问题,确保整个团队共同接受或拒绝AI功能,从而减少干扰。通过分析50,000用户的合成数据集,展示了如何估计直接效果和溢出效果,并强调了在协作产品实验中采用集群随机化的重要性。

协作AI功能的产品实验:基于Python的LLM工具中的集群随机化

freeCodeCamp.org
freeCodeCamp.org · 2026-05-22T19:15:56Z
使用LLM嵌入和元数据构建上下文感知的Python搜索

本文介绍了如何使用Python构建上下文感知的语义搜索引擎,结合嵌入式相似性和结构化元数据过滤。内容涵盖句子嵌入和余弦相似度的原理,构建元数据感知的搜索索引,以及索引的持久化方法。这些技术能够有效找到与用户查询相关的文档,同时考虑上下文约束。

使用LLM嵌入和元数据构建上下文感知的Python搜索

MachineLearningMastery.com
MachineLearningMastery.com · 2026-05-22T12:00:56Z
网易游戏如何在Kubernetes上实现30秒的LLM冷启动

在网易游戏,我们发现大语言模型(LLM)推理的关键在于数据传输速度。通过使用Fluid,我们将模型加载时间从42分钟缩短至3分钟,显著提高了推理效率。同时,Fluid支持跨命名空间共享模型,减少内存浪费,简化操作,使得在Kubernetes上进行LLM推理变得可行且高效。

网易游戏如何在Kubernetes上实现30秒的LLM冷启动

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-05-21T11:00:00Z
Modular:为何LLM推理需要一种新型路由器 - 第二部分

本文讨论了Modular Cloud的路由系统数据层,强调高效处理实时推理请求的重要性。通过分片位图和斐波那契哈希,系统能够在微秒级别内快速查询缓存状态,确保低延迟推理请求。同时,设计考虑了并发事件流的实时更新和主机生命周期管理,以优化性能和响应速度。

Modular:为何LLM推理需要一种新型路由器 - 第二部分

Modular Blog
Modular Blog · 2026-05-21T00:00:00Z
大脑其实像LLM持续预测下一秒:你每秒都在重新生成自己

本文探讨大脑作为“自回归生成器”的理论,认为大脑通过不断预测下一秒的体验状态,整合记忆、注意力和知觉等功能为统一的预测过程。知觉是主动生成的,记忆是重新生成的,意识则是这一过程的主观体验。这一理论挑战了传统认知心理学,提供了新的理解框架。

大脑其实像LLM持续预测下一秒:你每秒都在重新生成自己

极道
极道 · 2026-05-20T12:53:00Z

本文介绍了2026年免费LLM API的指南,涵盖13家提供商,如Google Gemini和OpenAI,提供AI网关高级玩法和本地模型方案,帮助用户以零成本实现生产工作流。

2026 年免费 LLM API 完全指南:13 家提供商 + AI 网关高级玩法 + 本地模型

夜法之书
夜法之书 · 2026-05-19T02:00:00Z
通过LLM评估优化实验——一个漏斗,而非分叉

LLM评估是一种新工具,能够快速、低成本地评估内容的相关性和质量。Spotify的实验表明,评估与实验应结合使用,评估帮助筛选候选项,实验验证用户反应。通过不断调整评估,提升其与在线结果的匹配度,确保系统的有效性和用户体验。

通过LLM评估优化实验——一个漏斗,而非分叉

Spotify Engineering
Spotify Engineering · 2026-05-18T13:27:23Z
LeCun炮轰Hinton:他认可LLM就是想摆烂退休了!

Lecun与Hinton对大型语言模型(LLM)的看法存在显著分歧。Hinton认为LLM接近人类智能,而Lecun则认为LLM并非通往人类智能的路径,强调世界模型的重要性,认为智能系统需要预测行为后果的能力。Lecun最近离开Meta,创办了AMI,专注于现实世界的AI应用,认为突破性研究需要优秀人才和资源支持。

LeCun炮轰Hinton:他认可LLM就是想摆烂退休了!

量子位
量子位 · 2026-05-18T05:59:37Z

文章探讨了如何将大型语言模型(LLM)视为具备人类特征的合作伙伴,以提升Agent工程的效率。强调认知对齐、记忆解耦、视觉感知优化和反馈机制的重要性,建议为LLM构建拟人化的交互环境,避免传统的机械指令模式。通过科学的工作流程和工具链设计,Agent可以更有效地解决问题,实现更高的工作效率。

把 LLM 当成“人”,才是 Agent 工程进阶的起点

HikariLan's Blog
HikariLan's Blog · 2026-05-17T13:46:11Z

该文章讨论了在rust-lang/rust GitHub项目中添加大型语言模型(LLM)政策的提议,主要包括禁止评论LLM的社会经济影响、环境影响、版权状态及道德判断。管理团队将协助执行这些规则。

为rust-lang/rust添加大型语言模型(LLM)政策

Drew DeVault's blog
Drew DeVault's blog · 2026-05-15T00:00:00Z

Amit Navindgi discusses the systematic shift at Zoox from fragmented documentation to an AI-driven ecosystem. He explains how they built "Cortex," a secure platform integrating RAG, multi-modal...

Presentation: Accelerating LLM-Driven Developer Productivity at Zoox

InfoQ
InfoQ · 2026-05-14T13:05:00Z
使用合成控制进行产品实验:Python中全球LLM发布的因果推断

在产品实验中,全球发布模型升级可能导致测量陷阱,缺乏对照组。合成控制方法通过构建未处理单位的加权组合,帮助数据科学家在没有对照组的情况下进行因果推断。本文介绍了如何使用Python实现合成控制,验证其有效性,并讨论常见的失败模式及应对策略。

使用合成控制进行产品实验:Python中全球LLM发布的因果推断

freeCodeCamp.org
freeCodeCamp.org · 2026-05-12T04:55:04Z

本文探讨了如何利用大语言模型(LLM)管理安全开发规范,通过建立llm-wiki中间层,将原始文档编译成结构化数据,以提升文档的可查找性和维护性。作者分享了实现过程,包括生成操作手册、收集原始素材、让LLM生成Wiki层以及最终规范文档的生成。经过多轮迭代和细化,最终形成了高效的知识管理系统,显著改善了文档的使用体验和更新机制。

用LLM管理安全开发规范:一次llm-wiki实践

Mobility
Mobility · 2026-05-11T07:38:16Z

本文探讨了如何利用大语言模型(LLM)管理安全开发规范。通过建立一个llm-wiki中间层,将原始文档编译成结构化数据,生成操作手册CLAUDE.md,收集素材,并最终输出规范文档。这种方法提高了文档管理效率,确保信息的可持续更新和交叉引用,解决了传统文档管理中的问题。

用LLM管理安全开发规范:一次llm-wiki实践

Mobility
Mobility · 2026-05-11T07:38:16Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码