小红花·文摘

本研究提出了一种新颖的概率框架，通过贝叶斯推理理解神经网络中的任务表示，旨在推断表示单元对任务性能的因果贡献。研究结果为理解神经网络表现提供了重要的信息论工具。