ChatGPT大语言模型只是句子补全?

如果你知道什么是马尔可夫链,就很容易把大语言模型想象成一个非常大的马尔可夫链,如果你知道,就把它等同于”句子补全“。 想象一下,你让一台计算机阅读世界上的每一本书,然后让它为书中的每一个三字短语构建一个列表。然后,对于每一个短语,你让它列出它所看到的在该短语之后出现的所有单词,并根据出现的频率进行排序。 然后你给它的短语是: 猫坐在___...

本文介绍了大语言模型的原理,将其比喻为一个巨大的马尔可夫链。计算机可以从一组相关的事实中推理出结论,这种能力被认为是理解的一种形式。

原文中文,约1200字,阅读约需3分钟。发表于:
阅读原文