DEV Community ·

通过平均化走向人工通用智能

💡 原文英文，约1600词，阅读约需6分钟。

📝

内容提要

近期讨论大型语言模型（LLM）是否能实现人工通用智能（AGI）。当前的LLM如GPT系列在某些任务上超越人类，但仍有局限性。尽管技术进步迅速，AGI仍然遥远，未来可能会出现更多开源模型和特定应用的LLM。

🎯

🔎

尽管大型语言模型（LLM）在某些任务上超越人类，但它们仍然属于人工狭义智能（ANI），而非真正的人工通用智能（AGI）。LLM的架构主要依赖于模式匹配和近似推理，缺乏深层次的逻辑推理能力，这使得它们在实现AGI的道路上面临重大挑战。

2023年，多个开源LLM模型如Mistral和Falcon相继发布，标志着竞争的加剧。这些模型不仅提供了商业使用的可能性，还允许用户访问模型权重和训练代码，可能会推动技术的进一步发展和应用。

DeepSeek的发布显示出其训练成本远低于竞争对手，这可能会对整个LLM市场产生深远影响。随着成本的降低，更多公司可能会选择开源模型，从而改变行业格局，甚至影响相关硬件供应商的市场价值。

❓

目前的LLM仍然是人工狭义智能（ANI），真正的AGI仍在未来，LLM的架构并不支持深层推理。

GPT系列从2018年的GPT-1到2023年的GPT-4经历了显著的参数增长和能力提升，尤其是GPT-3和GPT-4的突破。

2023年发布的开源模型包括Mistral、Falcon和Meta的Llama，这些模型在商业使用上有不同的限制。

LLM在编程领域的应用正在迅速发展，尽管不会取代程序员，但将成为编程工具的重要组成部分。

DeepSeek以低于竞争对手的训练成本和开源的方式发布，标志着LLM领域的一个重要时刻。

LLM存在不准确性和幻觉问题，尤其在处理未训练过的特定问题时表现不佳。

🏷️