量子位 ·

不好！1930年的AI都来抢程序员饭碗了

💡 原文中文，约2300字，阅读约需6分钟。

📝

内容提要

一款名为talkie-1930-13b的AI模型经过微调后成功解决了编程问题，展现出推理能力。尽管其知识仅限于1930年，但在软件工程领域的表现令人惊讶，挑战了对智能的传统理解。

🎯

🔎

talkie-1930-13b模型的表现挑战了我们对智能的传统理解。尽管其知识仅限于1930年，但通过微调后，它展现出解决编程问题的能力。这提示我们，智能的本质可能不在于数据量的多少，而在于基本的语言理解和推理能力。

该模型在仅250个训练样本后成功解决了编程问题，显示出微调在AI模型中的重要性。即使是知识有限的模型，通过适当的训练方法，也能在特定任务上取得显著进展，这为未来的AI开发提供了新的思路。

talkie-1930-13b与其兄弟模型talkie-web的表现接近，后者使用了互联网数据。这表明，尽管数据来源不同，模型的设计和训练方法在智能表现上可能更为关键。这为AI研究者提供了新的视角，值得深入探讨。

❓

talkie-1930-13b模型的主要特点是其训练数据仅限于1930年之前，展现出推理能力，并成功解决编程问题。

该模型经过250个训练样本的微调后，成功为xarray库打补丁，尽管过程缓慢且多次失败，但最终能够自我修正并完成任务。

与现代模型相比，talkie-1930-13b的知识仅限于1930年，且在没有互联网数据的情况下仍能展现出相似的推理能力。

在扩展训练数据后，talkie-1930-13b在SWE-bench-Verified上的表现达到了4.5%的pass@1，显示出显著提升。

因为该模型在仅有1930年知识的情况下，经过微调后仍能展现出基本的语言理解和推理能力，表明智能的本质可能不在于数据量，而在于理解能力。

talkie-1930-13b的开发团队包括AI研究员Nick Levine、多伦多大学副教授David Duvenaud，以及GPT系列之父Alec Radford。

🏷️