机器之心 ·

Yann LeCun说自回归要完，但DeepMind这篇论文却证明自回归能实现通用计算

💡 原文中文，约4800字，阅读约需12分钟。

📝

内容提要

DeepMind和阿尔伯塔大学的研究显示，自回归大型语言模型（LLM）无需外部干预即可实现通用计算。尽管Yann LeCun对此持怀疑态度，研究通过扩展自回归解码，证明LLM能模拟图灵机。使用Lag系统和特定提示词，gemini-1.5-pro-001模型在贪婪解码下执行复杂规则，挑战了传统看法。

🎯

🔎

尽管Yann LeCun对自回归模型持怀疑态度，认为其未来不乐观，但DeepMind的研究表明，自回归大型语言模型（LLM）在无需外部干预的情况下，能够实现通用计算。这一发现可能会改变业界对自回归模型的看法，值得关注其在实际应用中的潜力。

研究中提到的Lag系统是通用计算的一种变体，能够通过特定的规则模拟图灵机。这一方法的成功应用，表明了自回归模型在处理复杂计算任务时的灵活性和潜力，尤其是在长输入字符串的情况下，可能为未来的计算模型设计提供新的思路。

DeepMind团队通过开发特定的提示词，使gemini-1.5-pro-001模型能够在贪婪解码下执行复杂规则。这一过程的复杂性和严谨性，强调了在验证大型语言模型能力时，设计合理的实验和提示策略的重要性，未来的研究可以借鉴这一方法。

❓

DeepMind的研究表明，自回归大型语言模型（LLM）无需外部干预即可实现通用计算。

Yann LeCun对自回归模型持怀疑态度，认为其未来不乐观。

论文标题为《Autoregressive Large Language Models are Computationally Universal》。

研究通过扩展自回归解码的方法，证明无辅助的LLM可以模拟通用图灵机。

gemini-1.5-pro-001模型在贪婪解码下执行复杂规则，能够模拟通用计算。

Lag系统是一种通用计算模型，研究表明自回归解码可以通过Lag系统复现。

🏷️