小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

塔勒布的无限猴子理论指出,随机性可以生成任何内容。而现代的大语言模型(LLM)通过学习人类文本,基于统计规律生成文本,显著提高了生成有序内容的概率。LLM将人类知识压缩为概率分布,降低了获取知识的成本。尽管LLM缺乏真正的理解,但它在随机与智能之间创造了一种新能力。

LLM就是那群终于打出莎士比亚的猴子

Finisky Garden
Finisky Garden · 2026-04-02T05:14:00Z
Meta自适应排名模型:弯曲推理扩展曲线以服务于广告的LLM规模模型

Meta通过自适应排名模型提升广告推荐系统效率,解决了模型复杂性与系统效率的矛盾,实现低延迟和高效能,显著提高广告转化率和点击率。该模型通过请求导向优化与深度模型系统协同设计,确保每个请求由最有效的模型处理,以满足全球用户需求。

Meta自适应排名模型:弯曲推理扩展曲线以服务于广告的LLM规模模型

Engineering at Meta
Engineering at Meta · 2026-03-31T16:00:17Z
从提示到预测:理解LLM中的预填充、解码和KV缓存

本文介绍了如何使用PyTorch实现选择器函数,生成条件张量,并计算不同注意力头的得分矩阵,最终得到上下文向量。

从提示到预测:理解LLM中的预填充、解码和KV缓存

MachineLearningMastery.com
MachineLearningMastery.com · 2026-03-30T20:47:02Z
Kubernetes上的大型语言模型(LLM)第一部分:理解威胁模型

在运行大型语言模型(LLM)时,需关注安全风险,包括提示注入、敏感信息泄露、供应链风险和过度自主性。建议在应用层实施输入验证和输出过滤,并通过政策层管理这些风险,以确保模型行为符合安全标准。

Kubernetes上的大型语言模型(LLM)第一部分:理解威胁模型

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-03-30T11:00:00Z
LLM 工程化在福 uu 中的落地实践 —— 假期自动调课的智能解析

本文介绍了如何解析调课通知,提取调整前后日期的信息,包括课程取消和补课安排,最终输出为包含多条调课信息的列表。

LLM 工程化在福 uu 中的落地实践 —— 假期自动调课的智能解析

宝硕博客
宝硕博客 · 2026-03-30T06:55:00Z

自2022年底发布以来,OpenAI的ChatGPT迅速普及。基于Transformer架构的大语言模型(LLM)展现出强大能力,尤其在文本生成和教学中表现优异,但仍需人类引导。未来,LLM可能面临训练数据劣化的瓶颈,并与人类智能存在本质差异。

三年LLM:过去和未来

Yi's Blog
Yi's Blog · 2026-03-28T05:00:00Z
Athena:用于与大型语言模型(LLM)协作生成应用的中间表示

生成完整用户界面的代码对大型语言模型(LLM)具有挑战性。本文介绍了原型应用生成环境Athena,通过共享中间表示(如应用故事板、数据模型和GUI框架),帮助开发者与LLM协作生成结构化代码。用户研究显示,75%的参与者更倾向于使用Athena原型。

Athena:用于与大型语言模型(LLM)协作生成应用的中间表示

Apple Machine Learning Research
Apple Machine Learning Research · 2026-03-27T00:00:00Z

文章讨论了AI在破解Python3沙箱中的局限性,指出其在对抗性CTF任务中的表现不佳,强调人类在创新和解决问题上的优势。AI擅长优化任务,但在启发式搜索和随机性方面,尤其处理JSON格式时,表现欠佳。

无用之用——或许LLM真的还不是AGI

Est's Blog
Est's Blog · 2026-03-25T13:40:00Z
IBM、红帽和谷歌刚刚向CNCF捐赠了一份用于LLM推理的Kubernetes蓝图

谷歌云的早期测试表明,新方法在推理速度和成本上优于旧方法,代码补全等用例的首次响应时间提高了2倍,原因在于传统的自动扩展和请求路由不适合状态推理工作负载。

IBM、红帽和谷歌刚刚向CNCF捐赠了一份用于LLM推理的Kubernetes蓝图

The New Stack
The New Stack · 2026-03-24T15:20:01Z
欢迎 llm-d 加入 CNCF:将 Kubernetes 发展为先进的 AI 基础设施

llm-d旨在通过模型和状态感知路由策略,在任何加速器上实现先进的推理性能,最大化资源利用并提升推理指标。该项目提供标准化基准,确保高性能AI服务的可用性,并在多租户SaaS场景中显著节省计算资源。

欢迎 llm-d 加入 CNCF:将 Kubernetes 发展为先进的 AI 基础设施

Cloud Native Computing Foundation
Cloud Native Computing Foundation · 2026-03-24T07:45:00Z

本文介绍了如何在快速发展的AI领域中,通过社交媒体找到高质量信息,推荐了十个Twitter账户,涵盖LLM更新、研究、实用工具和深度见解,帮助用户过滤噪音,获取有价值内容。

关注LLM更新的10个最佳Twitter账户

KDnuggets
KDnuggets · 2026-03-23T16:00:21Z

文章讨论了AI基础设施的最新动态,包括NVIDIA的Feynman架构和Rosa CPU、LinkedIn的LLM内容排序系统以及Armis的安全报告。强调了LLM技术从研究到生产的重要性,以及在安全性和效率优化方面面临的挑战。智能体基础设施逐渐成熟,涵盖计算、编排、记忆和金融等多个层面。

AI Infra Brief|生产级 LLM 基础设施规模化落地;效率与安全新信号(2026.03.21)

dotNET跨平台
dotNET跨平台 · 2026-03-23T00:03:02Z

本文介绍了使用OpenCV进行文档图像自动矫正的方法,主要通过透视变换将倾斜照片转换为正面矩形视图。核心步骤包括图像预处理、轮廓检测和透视变换,提供了Python代码实现,能有效提高OCR识别准确率。

在线教程丨狂揽7.7万stars,LLM Course覆盖从入门到进阶的干货知识与实战课程

HyperAI超神经
HyperAI超神经 · 2026-03-19T07:28:22Z
瑞安·兰伯特:使用OpenWeb UI和Ollama的本地LLM

本文讨论了使用Ollama和OpenWeb UI运行本地LLM的经验,强调数据隐私和离线操作的重要性。作者分享了硬件需求、模型管理和自定义功能,指出RAG功能的局限性,并探讨了集成网络搜索的必要性。总体而言,Ollama与OpenWeb UI的结合满足了作者的编程需求。

瑞安·兰伯特:使用OpenWeb UI和Ollama的本地LLM

Planet PostgreSQL
Planet PostgreSQL · 2026-03-18T05:01:00Z
Prose2Policy(P2P):一种实用的LLM管道,用于将自然语言访问控制政策转换为可执行的Rego代码

Prose2Policy(P2P)是一种基于LLM的工具,能够将自然语言访问控制政策转换为可执行的Rego代码。它提供模块化的端到端流程,支持政策检测、组件提取和模式验证等功能。评估结果显示,P2P在ACRE数据集上的政策编译率为95.3%,自动测试通过率为82.2%,表明其在零信任和合规环境中的良好表现。

Prose2Policy(P2P):一种实用的LLM管道,用于将自然语言访问控制政策转换为可执行的Rego代码

Apple Machine Learning Research
Apple Machine Learning Research · 2026-03-18T00:00:00Z
LLM Agent 常用范式详解

本文介绍了 LLM Agent 的多种范式,包括单步回答、链式思维、ReAct、反思型、任务规划、记忆增强和多 Agent 协作。详细说明了每种范式的特点、适用场景及其优势与局限,强调了模型能力与实现成本之间的关系。

LLM Agent 常用范式详解

白云苍狗
白云苍狗 · 2026-03-17T02:35:09Z
如何在FastAPI中使用OpenTelemetry构建端到端的LLM可观察性

本文介绍了如何使用FastAPI和OpenTelemetry构建可观察的RAG(检索增强生成)API,模拟文档检索、LLM调用和后处理过程,通过创建不同的追踪跨度监控各阶段的性能和成本。

如何在FastAPI中使用OpenTelemetry构建端到端的LLM可观察性

freeCodeCamp.org
freeCodeCamp.org · 2026-03-13T16:13:16Z
DoorDash构建LLM对话模拟器,以大规模测试客服聊天机器人

DoorDash开发了一种模拟评估系统,能够快速进行数百次客服聊天机器人测试,显著提高实验效率。该系统将幻觉率降低了约90%,通过生成真实客户互动的多轮对话,结合自动评估框架,确保聊天机器人在实际场景中的表现。工程师通过持续迭代优化提示和上下文处理,以达到上线前的评估标准。

DoorDash构建LLM对话模拟器,以大规模测试客服聊天机器人

InfoQ
InfoQ · 2026-03-13T14:12:00Z
Qt Creator 19 IDE 发布,内置小地图和用于 AI/LLM 的内置 MCP 服务器

Qt 开发人员发布了 Qt Creator 19,新增小地图功能,改进远程设备管理,支持基本模型上下文协议(MCP)服务器,并增强对多种项目的支持。

Qt Creator 19 IDE 发布,内置小地图和用于 AI/LLM 的内置 MCP 服务器

实时互动网
实时互动网 · 2026-03-13T01:53:33Z

多智能体系统的构建日益受到关注。CrewAI提供了一个直观的框架,便于协调AI智能体合作完成复杂任务,强调简单性和生产就绪性。

每位LLM工程师必知的10个Python库

KDnuggets
KDnuggets · 2026-03-10T12:00:33Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码