量子位 ·

10万引普林斯顿刘壮最新访谈：架构没那么重要，数据才是王道

💡 原文中文，约14800字，阅读约需36分钟。

📝

内容提要

刘壮教授在访谈中指出，AI领域的最大瓶颈是记忆，而非能力。他认为架构选择不如数据规模和计算能力重要，现有数据集的多样性低于预期。大语言模型在语言空间有世界模型，但在视觉空间尚未实现。尽管AI在低层次任务上表现良好，但在自主科研和复杂问题上仍需人类参与。

🎯

🔎

刘壮教授强调，AI领域的最大瓶颈在于记忆，而非能力。这意味着，尽管当前的模型在推理能力上已经相对成熟，但缺乏稳定的长期记忆会限制其在复杂任务中的表现。未来的研究应更加关注如何提升模型的记忆能力，以便更好地处理复杂的任务和上下文信息。

刘壮教授指出，现有的数据集多样性远低于预期，这可能影响模型的泛化能力。尽管数据集规模不断扩大，但如果数据之间的差异性不足，模型在实际应用中可能仍然面临偏见和局限。因此，研究者在选择和构建数据集时，应更加关注数据的多样性和代表性。

在访谈中，刘壮教授提到架构选择的重要性不如数据规模和计算能力。这一观点提示我们，在AI模型的开发中，研究者应优先考虑数据的质量和数量，而不是过于依赖架构创新。这种思路有助于推动AI技术的实际应用和发展。

❓

刘壮教授认为AI领域的最大瓶颈是记忆，而非能力。

刘壮教授认为架构选择不如数据规模和计算能力重要，架构的选择并没有想象中那么重要。

大语言模型在语言空间有世界模型，但在视觉空间尚未实现，主要是因为视觉数据的信息密度太高。

刘壮教授认为AI在自主科研方面还未到位，无法替代研究生，尤其是在提出有趣问题和设计实验上。

刘壮教授指出现有数据集的多样性低于预期，很多号称多样化的数据集在模型眼里仍然泾渭分明。

刘壮教授认为AI在低层次任务上表现良好，但在复杂问题上仍需人类参与。

🏷️