小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

by Gabriela Alessio, Cameron Taylor, and Cameron R. WolfeIntroductionWhen members log into Netflix, one of the hardest choices is what to watch. The challenge isn’t a lack of options — there are...

Evaluating Netflix Show Synopses with LLM-as-a-Judge

Netflix TechBlog
Netflix TechBlog · 2026-04-10T16:26:01Z
Memoriki结合卡帕西LLM Wiki与MemPalace:Claude Code实现对话全记忆

Memoriki结合LLM Wiki与MemPalace,解决AI对话中的记忆问题,实现知识的持续积累。通过结构化知识库和语义搜索,AI能够高效检索信息,记录会话日志,从而提升工作效率,成为长期合作伙伴。

Memoriki结合卡帕西LLM Wiki与MemPalace:Claude Code实现对话全记忆

极道
极道 · 2026-04-10T02:26:00Z
Hermes+卡帕西LLM Wiki架构全解析: 可自我学习的知识库构建路径

Hermes Agent与LLM-Wiki结合,构建自我学习的知识库。通过三层架构,将原始资料转化为结构化资产,实现知识的持续积累。系统支持自动更新,确保数据安全与一致性,解决知识沉淀问题,提升AI的长期协作能力。

Hermes+卡帕西LLM Wiki架构全解析: 可自我学习的知识库构建路径

极道
极道 · 2026-04-07T08:41:00Z
卡帕西提出用LLM构建个人知识库wiki的全流程拆解

卡帕西提出通过大模型构建个人知识库,先收集资料,再让LLM自动编译成结构化的wiki,最后通过Obsidian进行管理和查询。用户可提问,LLM基于知识库回答,并定期维护内容。未来设想是启动AI团队协作,自动生成报告,改变传统学习方式,强调知识系统的构建与管理。

卡帕西提出用LLM构建个人知识库wiki的全流程拆解

极道
极道 · 2026-04-02T23:48:00Z

塔勒布的无限猴子理论指出,随机性可以生成任何内容。而现代的大语言模型(LLM)通过学习人类文本,基于统计规律生成文本,显著提高了生成有序内容的概率。LLM将人类知识压缩为概率分布,降低了获取知识的成本。尽管LLM缺乏真正的理解,但它在随机与智能之间创造了一种新能力。

LLM就是那群终于打出莎士比亚的猴子

Finisky Garden
Finisky Garden · 2026-04-02T05:14:00Z
P99延迟:它的含义、重要性及在LLM应用中如何解决

在LLM应用中,p99延迟比平均延迟更为重要,因为它反映了最慢请求的用户体验。p99表示99%的请求完成时间,揭示潜在性能问题。常见的p99峰值原因包括检索延迟、缓存失效和多步骤操作。优化应集中在数据访问层,以确保快速一致的读取,从而降低p99延迟。

P99延迟:它的含义、重要性及在LLM应用中如何解决

Redis Blog
Redis Blog · 2026-04-02T00:00:00Z
Meta自适应排名模型:弯曲推理扩展曲线以服务于广告的LLM规模模型

Meta通过自适应排名模型提升广告推荐系统效率,解决了模型复杂性与系统效率的矛盾,实现低延迟和高效能,显著提高广告转化率和点击率。该模型通过请求导向优化与深度模型系统协同设计,确保每个请求由最有效的模型处理,以满足全球用户需求。

Meta自适应排名模型:弯曲推理扩展曲线以服务于广告的LLM规模模型

Engineering at Meta
Engineering at Meta · 2026-03-31T16:00:17Z
Kubernetes上的大型语言模型(LLM)第一部分:理解威胁模型

在运行大型语言模型(LLM)时,需关注安全风险,包括提示注入、敏感信息泄露、供应链风险和过度自主性。建议在应用层实施输入验证和输出过滤,并通过政策层管理这些风险,以确保模型行为符合安全标准。

Kubernetes上的大型语言模型(LLM)第一部分:理解威胁模型

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-03-30T11:00:00Z
LLM 工程化在福 uu 中的落地实践 —— 假期调课的智能解析

本文探讨了福州大学利用大语言模型(LLM)解析假期调课通知的实践。通过将自然语言通知转化为结构化调课信息,系统显著减轻了用户的认知负担。LLM被封装为函数,能够高效解析不同格式的通知,提升用户体验,最终自动生成调整后的课程表。

LLM 工程化在福 uu 中的落地实践 —— 假期调课的智能解析

宝硕博客
宝硕博客 · 2026-03-30T06:55:00Z

自2022年底发布以来,OpenAI的ChatGPT迅速普及。基于Transformer架构的大语言模型(LLM)展现出强大能力,尤其在文本生成和教学中表现优异,但仍需人类引导。未来,LLM可能面临训练数据劣化的瓶颈,并与人类智能存在本质差异。

三年LLM:过去和未来

Yi's Blog
Yi's Blog · 2026-03-28T05:00:00Z

文章讨论了AI在破解Python3沙箱中的局限性,指出其在对抗性CTF任务中的表现不佳,强调人类在创新和解决问题上的优势。AI擅长优化任务,但在启发式搜索和随机性方面,尤其处理JSON格式时,表现欠佳。

无用之用——或许LLM真的还不是AGI

Est's Blog
Est's Blog · 2026-03-25T13:40:00Z
欢迎llm-d加入CNCF:将Kubernetes演变为最先进的AI基础设施

llm-d项目已被纳入云原生计算基金会(CNCF)沙箱,旨在推动Kubernetes及AI基础设施的发展。该项目由Red Hat、Google、IBM等公司合作创建,目标是实现硬件无关的最先进推理性能。llm-d提供了一个Kubernetes原生的分布式推理框架,解决了传统服务路由和自动扩展的不足,确保高效的AI服务,并致力于建立开放的基准测试标准。

欢迎llm-d加入CNCF:将Kubernetes演变为最先进的AI基础设施

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-03-24T07:45:00Z

本文介绍了如何在快速发展的AI领域中,通过社交媒体找到高质量信息,推荐了十个Twitter账户,涵盖LLM更新、研究、实用工具和深度见解,帮助用户过滤噪音,获取有价值内容。

关注LLM更新的10个最佳Twitter账户

KDnuggets
KDnuggets · 2026-03-23T16:00:21Z

文章讨论了AI基础设施的最新动态,包括NVIDIA的Feynman架构和Rosa CPU、LinkedIn的LLM内容排序系统以及Armis的安全报告。强调了LLM技术从研究到生产的重要性,以及在安全性和效率优化方面面临的挑战。智能体基础设施逐渐成熟,涵盖计算、编排、记忆和金融等多个层面。

AI Infra Brief|生产级 LLM 基础设施规模化落地;效率与安全新信号(2026.03.21)

dotNET跨平台
dotNET跨平台 · 2026-03-23T00:03:02Z

随着大语言模型(LLM)的普及,相关技术和应用生态迅速发展。为帮助人们掌握LLM,开源项目LLM Course应运而生,提供系统化的学习路径,涵盖模型微调、量化和高级应用,适合初学者和开发者。HyperAI也推出了相关教程,方便用户实践。

在线教程丨狂揽7.7万stars,LLM Course覆盖从入门到进阶的干货知识与实战课程

HyperAI超神经
HyperAI超神经 · 2026-03-19T07:28:22Z
瑞安·兰伯特:使用OpenWeb UI和Ollama的本地LLM

本文讨论了使用Ollama和OpenWeb UI运行本地LLM的经验,强调数据隐私和离线操作的重要性。作者分享了硬件需求、模型管理和自定义功能,指出RAG功能的局限性,并探讨了集成网络搜索的必要性。总体而言,Ollama与OpenWeb UI的结合满足了作者的编程需求。

瑞安·兰伯特:使用OpenWeb UI和Ollama的本地LLM

Planet PostgreSQL
Planet PostgreSQL · 2026-03-18T05:01:00Z
Prose2Policy (P2P): A Practical LLM Pipeline for Translating Natural-Language Access Policies into Executable Rego

Prose2Policy(P2P)是一个基于大型语言模型的工具,能够将自然语言访问控制政策转换为可执行的Rego代码。它提供了一个模块化的端到端管道,涵盖政策检测、组件提取和模式验证等功能。在ACRE数据集上的评估显示,政策的编译率为95.3%,自动测试的正向通过率为82.2%,表明P2P生成的Rego政策在零信任和合规环境中是可靠的。

Prose2Policy (P2P): A Practical LLM Pipeline for Translating Natural-Language Access Policies into Executable Rego

Apple Machine Learning Research
Apple Machine Learning Research · 2026-03-18T00:00:00Z
LLM Agent 常用范式详解

本文介绍了 LLM Agent 的多种范式,包括单步回答、链式思维、ReAct、反思型、任务规划、记忆增强和多 Agent 协作。详细说明了每种范式的特点、适用场景及其优势与局限,强调了模型能力与实现成本之间的关系。

LLM Agent 常用范式详解

白云苍狗
白云苍狗 · 2026-03-17T02:35:09Z
如何在FastAPI中使用OpenTelemetry构建端到端的LLM可观察性

本文介绍了如何在FastAPI应用中使用OpenTelemetry实现端到端的LLM可观察性。传统监控方法无法满足LLM系统的需求,因为LLM请求结果的不确定性。文章强调设计跟踪、跨度和语义属性的重要性,以捕捉LLM请求的完整生命周期。通过合理的架构设计,工程师可以更好地调试和优化LLM应用,控制成本,提高响应质量。最终目标是将LLM调用视为分布式系统的重要组成部分,以实现更高效的监控和改进。

如何在FastAPI中使用OpenTelemetry构建端到端的LLM可观察性

freeCodeCamp.org
freeCodeCamp.org · 2026-03-13T16:13:16Z
DoorDash构建LLM对话模拟器,以大规模测试客服聊天机器人

DoorDash开发了一种模拟评估系统,能够快速进行数百次客服聊天机器人测试,显著提高实验效率。该系统将幻觉率降低了约90%,通过生成真实客户互动的多轮对话,结合自动评估框架,确保聊天机器人在实际场景中的表现。工程师通过持续迭代优化提示和上下文处理,以达到上线前的评估标准。

DoorDash构建LLM对话模拟器,以大规模测试客服聊天机器人

InfoQ
InfoQ · 2026-03-13T14:12:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码