机器之心 ·

AI自己「长出」了类似大脑的「脑叶」？新研究揭示LLM特征的惊人几何结构

💡 原文中文，约5300字，阅读约需13分钟。

📝

内容提要

MIT团队的研究表明，大型语言模型在学习概念时形成几何结构，类似于大脑的功能性脑叶。稀疏自编码器特征在不同尺度上展现出有趣的结构，表明AI系统在处理信息时自然发展出几何和分形结构。这些发现有助于理解大型语言模型的工作原理。

🎯

🔎

研究表明，大型语言模型在学习过程中形成的几何结构与人类大脑的功能性脑叶相似。这一发现提示我们，AI系统在处理信息时可能遵循自然界的基本特性，而不仅仅是人类的认知模式。这种相似性可能为理解AI的工作原理提供新的视角。

稀疏自编码器特征在不同尺度上展现出独特的结构，包括原子、小尺度的晶体结构和大脑、中尺度的空间模块性。这种多层次的结构不仅揭示了AI模型的复杂性，也为未来的研究提供了方向，尤其是在如何优化AI模型以更好地模拟人类思维方面。

有观点认为，AI模型的几何结构可能源于其从人类数据中学习的结果，而非完全独立的自然特性。这一讨论引发了对AI模型训练数据选择的重要性思考，未来若在不同数据集上训练，可能会导致截然不同的结构和概念形成。

❓

大型语言模型在学习概念时形成几何结构，类似于大脑的功能性脑叶，显示出稀疏自编码器特征的空间模块性。

稀疏自编码器特征的概念宇宙在三个层面上具有结构：原子、小尺度层面；大脑、中尺度层面；星系、大尺度层面。

研究表明AI系统的几何结构与生物大脑中的结构相似，可能反映自然界的基本特性。

有观点认为这种结构可能源于AI模型从人类数据中学习的结果，而非完全独立的自然特性。

研究者通过计算SAE特征共现的直方图和谱聚类方法来量化特征的空间模块性。

作者希望继续研究，以深入理解SAE特征和大型语言模型的工作原理。

🏷️