The Berkeley Artificial Intelligence Research Blog ·

大规模识别大型语言模型中的交互

💡 原文英文，约1500词，阅读约需6分钟。

📝

内容提要

理解大型语言模型等复杂机器学习系统的行为是现代人工智能的一大挑战。可解释性研究旨在提高决策过程的透明度，采用特征归因、数据归因和机制可解释性等方法分析模型行为。然而，特征和数据量的增加使分析变得更加复杂。SPEX和ProxySPEX算法通过消融技术有效识别关键交互，推动了可解释性研究的发展。

🎯

🏷️

谷歌研究人员提出大型语言模型的贝叶斯教学方法
谷歌研究人员提出了一种训练方法，使大型语言模型通过学习最佳贝叶斯系统的预测来近似贝叶斯推理。这种方法提升了模型在多步交互中更新信念的能力。研究表明，语言模...
基于微控制器的面部与语音识别：边缘AI咖啡机挑战
学生们在分布式软件开发课程中，利用ESP32-P4微控制器开发了一款具备面部和语音识别功能的智能咖啡机。该项目展示了边缘AI在提升办公体验方面的应用，所有...
2026 03 15 HackerNews
Claude平台推出Opus 4.6和Sonnet 4.6模型，支持100万token的上下文窗口，标准定价，无长上下文附加费。这些新功能提升了AI在科研...
Codex Skills 不是 Prompt 的升级版，而是写给 AI 的岗位 SOP
Codex的Skills机制被低估，它不仅是Prompt的升级，更是将分散的工作方法整理为可复用的执行单元。Skills强调稳定性和团队协作，适合长期任务...
别傻了，写出极致整洁的代码，是你升不了职的根本原因
在技术职场中，简单代码常被忽视，而复杂代码更易获得晋升。文章探讨了简单代码的价值，并提出如何展示其背后的复杂思考，以避免被低估。
LSM-Tree 全景：为什么要先写日志再排序
LevelDB通过两级缓存机制减少磁盘读取：Table Cache缓存SSTable文件句柄，Block Cache缓存热点数据块，采用ShardedLR...