小红花·文摘 - 小红花技术领袖俱乐部

大型（更大）语言模型：大而不倒？

IBM Blog ·

研究发现简化模型表示无法准确捕获深度学习系统的行为，尽管在训练集上可以准确近似全模型。使用奇异值分解等工具进行机械解释时，预测模型在新情况下的行为可能不可靠。

简化模型泛化中的可解释性错觉

BriefGPT - AI 论文速递 ·