小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
Loop Engineering 的代价:LLM 可用性是工程用 Token 买出来的

本文探讨了大型语言模型(LLM)在工程中的应用,强调了从Prompt Engineering到Loop Engineering的四个阶段。每个阶段通过增加token提升模型的可用性,解决了模型在执行任务时的局限性。尽管工程不断优化,模型能力未显著提升,真正的挑战在于如何定义和维持任务完成标准,最终仍需人类参与判断。

Loop Engineering 的代价:LLM 可用性是工程用 Token 买出来的

乱世浮生
乱世浮生 · 2026-06-24T12:55:28Z
刚刚,Claude Code大升级!卡帕西:LLM第三次变革

Anthropic推出了全新的企业协作工具Claude Tag,旨在提升团队协作能力。该工具能主动参与工作流程,处理任务并与团队共享上下文,用户可在Slack中直接@Claude进行任务分配和进度跟踪。Claude Tag具备持续记忆和主动介入的能力,理解组织知识,成为企业内部的统一入口。目前已开放Beta测试,未来将扩展至更多平台。

刚刚,Claude Code大升级!卡帕西:LLM第三次变革

量子位
量子位 · 2026-06-24T03:56:02Z
AI 范式雷达:《让 Agent 看见代码仓库——多模态表示如何重塑编码代理》

研究表明,基于 LLM 的代码修复 Agent 在纯视觉模式下修复准确率显著下降,而混合文本与视觉模式则提高了准确率并降低了 Token 成本。SeeRepo 提供了一种有效的仓库结构可视化管线,结合文本和视觉信息,优化了编码 Agent 的输入接口设计。

AI 范式雷达:《让 Agent 看见代码仓库——多模态表示如何重塑编码代理》

Micropaper
Micropaper · 2026-06-24T00:00:00Z
如何教小型语言模型(LLM)建议K12创意项目想法

本文介绍了如何利用小型语言模型(LLM)为教育应用程序生成创意项目建议。作者开发了一款基于活动学习的应用,使用维基百科数据构建数据集,并通过过滤和生成训练对来训练模型。文章详细阐述了模型的微调过程、评估方法及其在应用中的集成,确保生成内容适合儿童且安全。最终目标是根据教师提供的材料和年龄范围,生成结构化的教育活动建议。

如何教小型语言模型(LLM)建议K12创意项目想法

freeCodeCamp.org
freeCodeCamp.org · 2026-06-23T16:37:54Z
结合LLM嵌入和HDBSCAN的非结构化文本聚类

本文介绍了如何结合大型语言模型(LLM)嵌入和HDBSCAN算法构建文本聚类管道,以自动发现未标记文本数据中的主题。主要步骤包括生成文本嵌入、降低维度和应用聚类,最终成功识别出两个主题聚类,展示了该方法的有效性。

结合LLM嵌入和HDBSCAN的非结构化文本聚类

MachineLearningMastery.com
MachineLearningMastery.com · 2026-06-23T12:00:57Z

本文介绍了 git-cm,一款在终端中利用 LLM 生成符合规范的 commit message 的工具。它支持学习历史风格、检查邮箱和重写提交信息,旨在简化复杂改动的提交过程。安装简单,使用时只需添加文件并运行命令即可生成和确认 commit message。

git-cm:在终端里用 LLM 生成 commit message

BBing's Blog
BBing's Blog · 2026-06-23T09:28:09Z

一个 LLM 驱动的静态分析工具,零样本扔进去就出 0day,这事值得拆开看。

vulnhuntr 怎么把 LLM 框架的 RCE 一把梭扫出来

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2026-06-23T07:22:16Z
6 个开源 LLM 安全工具横评(2026):谁还活着,谁真正能用

2026年,LLM安全工具生态发生剧烈变动。评估了六个主要开源工具(Garak、PyRIT、Promptfoo、LLM Guard、NeMo Guardrails、Microsoft Presidio),涵盖攻击类型、兼容性和成熟度等维度。Garak和Presidio被认为是最稳的组合,适合不同规模的团队。生态逐渐向商业整合发展,开源工具面临维护风险。

6 个开源 LLM 安全工具横评(2026):谁还活着,谁真正能用

FreeBuf网络安全行业门户
FreeBuf网络安全行业门户 · 2026-06-23T07:22:03Z
LLM 究竟是如何工作的?

本文介绍了大型语言模型(LLM)的工作原理,重点在于transformer架构的核心机制,包括分词、嵌入、位置编码和注意力机制。LLM通过将文本转换为整数序列,利用嵌入矩阵赋予这些整数含义,并通过注意力机制在token之间交换信息。模型的训练依赖于预测下一个token,架构的不同主要体现在训练权重和配置选择上。

LLM 究竟是如何工作的?

鸟窝
鸟窝 · 2026-06-21T03:09:44Z

发布时间:2026 年 6 月 1 日,星期一 · 26 分钟阅读 Ma

LLM 究竟是如何工作的?

鸟窝
鸟窝 · 2026-06-21T03:09:44Z

Rust Secure Code Working Group 负责人 Shnatsel 发现,GPT-5.5 在审计 Rust unsafe 代码时表现出色,成功识别多种安全问题。通过聚焦内存安全并使用 miri 过滤假阳性,审计效率显著提高。这种方法可能使 Rust 生态的安全检查常态化。此外,Aurora 浏览器引擎和 Ratatui 项目展示了 Rust 在浏览器和嵌入式显示屏上的应用,guitar 则提升了大型 Git 仓库的历史管理效率。

【Rust日报】2026-06-21 LLM 审 Rust 代码,作者已实战挖出几十个问题

Rust.cc
Rust.cc · 2026-06-21T01:08:49Z
一分钟读论文:《当工具失败时:LLM智能体的动态重规划与异常恢复基准测试》

腾讯优图实验室与中山大学、清华大学合作的研究评估了大型语言模型(LLM)智能体在工具失败场景下的动态重规划能力。研究表明,隐式语义失败的恢复难度远高于显式故障,复杂的拓扑结构可能导致智能体陷入无效循环。此外,动态重规划能力的提升滞后于基本性能,强调了状态管理与异常检测结合的重要性。

一分钟读论文:《当工具失败时:LLM智能体的动态重规划与异常恢复基准测试》

Micropaper
Micropaper · 2026-06-21T00:00:00Z
Checkmarx的新型SAST引擎并不只是关于LLM,而是关于之后发生的事情。

Checkmarx推出了一款新型静态应用安全测试(SAST)引擎,结合了基于规则的扫描器、训练于安全数据的语言模型和发现分析引擎,以提高检测准确性。该引擎在测试中发现了327个传统模型漏掉的真实阳性,旨在简化用户体验,减少误报,提高代码安全性,帮助企业应对快速增长的代码量和安全挑战。

Checkmarx的新型SAST引擎并不只是关于LLM,而是关于之后发生的事情。

The New Stack
The New Stack · 2026-06-19T16:00:00Z
OpenClaw.NET 祭出 TokenJuice:Agent 时代的"Token 瘦身引擎",让 LLM 上下文不再膨胀 - 张善友

TokenJuice 是 OpenClaw.NET 的新功能,旨在优化 AI Agent 的工具输出,减少 Token 消耗。通过精细的规则匹配,TokenJuice 能在保持语义完整的同时压缩输出体积,提升响应速度,确保安全性和效率,适用于 .NET 开发者,解决上下文膨胀问题。

OpenClaw.NET 祭出 TokenJuice:Agent 时代的"Token 瘦身引擎",让 LLM 上下文不再膨胀 - 张善友

张善友
张善友 · 2026-06-19T12:37:00Z
[MAF预定义的AIContextProvider-01]TextSearchProvider——RAG在MAF中的实现 - Artech

ChatClientAgent通过输入增强和输出增强与大型语言模型(LLM)交互。检索增强生成(RAG)利用TextSearchProvider根据上下文检索相关信息,从而提升LLM的回答质量。文章示例展示了如何使用TextSearchProvider获取2026年斯诺克世锦赛冠军吴宜泽的信息,强调了RAG在解决LLM知识局限性中的重要性。

[MAF预定义的AIContextProvider-01]TextSearchProvider——RAG在MAF中的实现 - Artech

Artech
Artech · 2026-06-17T00:40:00Z
使用Scikit-LLM构建端到端情感分析管道

本文介绍了如何使用Scikit-LLM和Groq API构建情感分析管道,包括设置Scikit-LLM、准备IMDB电影评论数据集、构建零样本情感分类管道,并展示模型的预测性能。通过清洗文本数据和使用预训练模型,管道实现了高效的情感分类。

使用Scikit-LLM构建端到端情感分析管道

MachineLearningMastery.com
MachineLearningMastery.com · 2026-06-16T12:00:48Z
谷歌OKF开放知识格式:卡帕西LLM Wiki有了标准!

谷歌发布的开放知识格式(OKF)通过简单的Markdown和YAML结构,解决信息碎片化问题。该格式强调极少的强制规定、生产与消费分离,且供应商中立。文章介绍了相关工具,鼓励读者利用此格式提升信息管理效率。

谷歌OKF开放知识格式:卡帕西LLM Wiki有了标准!

极道
极道 · 2026-06-14T00:48:00Z
获取 AceDataCloud 平台模型列表

AceDataCloud平台提供公开API接口,用户可获取所有可用模型列表,包括LLM、图像、视频等。接口支持按服务和标签过滤,返回模型的详细信息,如ID、价格和能力标签。用户可通过cURL或Python调用该接口,便于集成模型选择功能。

获取 AceDataCloud 平台模型列表

静觅
静觅 · 2026-06-13T21:28:11Z
AI 语音聊天机器人背后是怎么实现的,是 ASR + LLM + TTS 串起来吗,延迟怎么压下去

AI语音聊天机器人的实现依赖多个模块的协同,关键在于整体架构、流式串联、并行与预测、传输与端侧优化。通过优化各环节,端到端延迟可降低至700~900毫秒,接近真人对话速度。团队应明确延迟目标,利用成熟技术平台降低工程门槛,专注于对话逻辑创新。未来,随着技术进步,延迟有望进一步降低。

AI 语音聊天机器人背后是怎么实现的,是 ASR + LLM + TTS 串起来吗,延迟怎么压下去

实时互动网
实时互动网 · 2026-06-12T07:33:39Z
使用Scikit-LLM进行多标签文本分类

本文介绍了如何使用scikit-LLM库进行多标签文本分类,利用大型语言模型(LLM)进行零-shot推理,无需标记训练数据。文章阐述了多标签分类的定义及其重要性,配置scikit-LLM的方法,以及如何加载真实数据集进行情感预测。通过示例,展示了为文本分配多个情感标签的简便性和高效性。

使用Scikit-LLM进行多标签文本分类

MachineLearningMastery.com
MachineLearningMastery.com · 2026-06-11T12:00:17Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码