BriefGPT - AI 论文速递 ·

敏感性与稀疏性：极端稀疏参数模式对大型语言模型心智理论的影响

📝

内容提要

本文研究大型语言模型中心智理论能力的出现，重点分析极端稀疏参数模式的作用。我们提出了一种新方法来识别对心智理论敏感的参数，结果表明，即使是0.001%的微小扰动也会显著降低这些模型的心智理论表现，影响上下文定位和语言理解。该研究为理解大型语言模型如何获得社会推理能力提供了深入见解，推动了人工智能可解释性与认知科学的结合。

🏷️

继续阅读

我热爱大型语言模型，但厌恶夸大宣传
作者对人工智能（AI）和大型语言模型（LLM）充满热情，认为技术进步令人振奋。他批评了关于AI将主宰未来的夸大宣传，认为这种负面情绪令人沮丧。AI的价值主...
SumatraPDF Plus 增强版：完美中文排版、全渲染暗黑模式、双击查词、大文件加速
SumatraPDF Plus 是基于开源 SumatraPDF 的增强版，增加了中文排版、暗黑模式、离线查词等功能，适合阅读中文 EPUB/MOBI，优...
【Rust日报】2026-07-13 fearless_simd 0.6 发布：AVX-512 支持正式落地，还能按目标机器精细关掉它
fearless_simd 0.6 发布：AVX-512 支持正式落地，还能按目标机器精细关掉它如果你最近在关注 Rust 生态里的 SIMD 基础设施...
Christophe Pettus: All Your GUCs in a Row: enable_tidscan
TID scans only happen when you explicitly ask for them via `ctid`, making `en...
苹果起诉OpenAI内幕
苹果起诉OpenAI内幕苹果起诉OpenAI窃取商业机密，焦点不只是前员工带走文件，而是AI硬件、供应链和未来手机入口之争。本文梳理苹果诉OpenAI...
早报｜曝苹果M7 Ultra最高支持1.5TB内存/海力士CEO:明年将迎史上最严峻储存短缺/马斯克奥特曼再次公开对垒
· 大众计划削减一半车型线，全球裁员规模或达 12 万人 · 扎克伯格否认 Meta 算力过剩：没人会嫌算力太多 · 宇树 G1 机器人完成两例活体手术，...

内容提要

标签

继续阅读