小红花·文摘

文章讨论了大语言模型（LLM）的可解释性，强调动态评估的重要性。尽管LLM在AI领域取得了突破，其内部运作仍不透明。研究者提出了基于SMILE的框架，通过分析用户输入的细微变化，提供模型决策的局部解释。同时，开发了使用开源模型的代理解决方案，以降低成本并实现模型可解释性。随着技术进步，LLM的可解释性正在快速发展，推动更可信的AI模型。

大语言模型可解释性入门

KDnuggets ·

国家数据局发布了2025年可信数据空间创新发展试点名单，共63个项目，涵盖城市、行业和企业数据空间。试点强调过程管理，入选单位需接受动态评估，以确保数据空间建设的活力与有效性。未来将扩展个人和跨境数据空间。

简析国家数据局公布2025年可信数据空间创新发展试点名单

绿盟科技技术博客 ·

本研究提出了KORGym，一个灵活的动态评估平台，旨在解决大型语言模型推理评估的局限性。通过对19个大型语言模型和8个视觉语言模型的实验，发现闭源模型表现更优，预计将推动语言模型推理研究的发展。

KORGym: A Dynamic Game Platform for Evaluating Reasoning in Large Language Models

BriefGPT - AI 论文速递 ·

本研究评估了开放语义映射（OSM）在不同光照条件下的表现，提出了动态评估管道OSMa-Bench，并引入新数据集，分析最新算法的性能，为未来机器人系统开发提供重要见解。

OSMa-Bench：在不同光照条件下评估开放语义映射

BriefGPT - AI 论文速递 ·

雅各布·斯坦哈特讨论了语言模型的内部和外部行为，指出当前评估方法的透明度和动态评估能力不足。他介绍了初创公司Transluce的工作，旨在通过分析模型的激活和行为来提升评估有效性，推动更开放的评估体系。

构建可扩展的系统以自动理解语言模型

Josherich的博客 ·

本研究提出了GameArena，通过与人类互动游戏动态评估大型语言模型（LLMs）的推理能力，克服了现有基准的局限性，并收集了2000多个游戏会话的数据。

GameArena: Evaluating the Reasoning Abilities of Large Language Models through Real-Time Computer Games

BriefGPT - AI 论文速递 ·

本研究提出了一种自适应图文质量增强模型（AITQE），用于提升多模态大语言模型训练中的图文配对质量。通过动态评估、文本重写和负样本学习策略，提高了数据利用率和扩展性，并在基准测试中表现优异。

Beyond Filtering: Adaptive Image-Text Quality Enhancement for Pre-training Multimodal Large Language Models

BriefGPT - AI 论文速递 ·