机器之心 ·

上海交大张拳石：思维链只是表象，DeepSeek凭什么更强 | 智者访谈

💡 原文中文，约14300字，阅读约需34分钟。

📝

内容提要

张拳石教授探讨了AI模型的可解释性，特别是DeepSeek-R1模型的思维链是否真实反映其推理机制。他提出了“等效与或交互”理论，通过数学符号化解释神经网络的表征逻辑，强调在高风险领域（如医疗、法律）中理解AI决策机制的重要性。

🎯

🔎

张拳石教授指出，DeepSeek-R1模型的思维链并不一定能真实反映其推理机制。尽管思维链为用户提供了模型处理信息的窗口，但其严谨性仍需进一步探讨，尤其在高风险领域如医疗和法律中，理解AI的决策机制至关重要。

在高风险应用中，AI的可解释性不仅关乎结果的正确性，更涉及到决策过程的透明性。张教授强调，传统的正确率评估方法不足以全面评估大模型的潜在风险，需建立新的评测体系，关注模型内部逻辑的可靠性。

张教授提出的“等效与或交互”理论为理解神经网络的内在表征提供了新的视角。该理论不仅适用于自然语言处理，还可扩展到图像分类等领域，强调了神经网络的泛化性和鲁棒性与交互阶数的关系，具有广泛的应用潜力。

❓

思维链的展示并不一定代表模型的内在推理机制，张教授认为它与传统生成语言模型没有本质区别，仍是对人类问答数据的经验性拟合。

该理论通过数学符号化解释神经网络的内在表征逻辑，强调理解泛化性和鲁棒性的重要性，适用于多种神经网络模型。

在医疗、法律等高风险领域，理解AI的决策机制至关重要，以确保决策的可靠性和安全性，避免潜在的风险。

可解释性研究中有两类算法：一类是迎合人类认知的解释，另一类是从数学上对神经网络进行客观解释。

张教授认为AI的欺骗行为是一个数学问题，强调机器的透明性和可分析性，认为可以通过技术手段深入分析其内在逻辑。

评估大模型时应关注潜在风险，而不仅仅是端到端的正确率，需建立新的评测体系以准确评价模型性能。

🏷️