Apple Machine Learning Research ·

LaCy：小型语言模型可以和应该学习的内容不仅仅是损失问题

💡 原文英文，约500词，阅读约需2分钟。

📝

内容提要

本文探讨了小型语言模型（SLMs）在预训练过程中应学习的标记及何时通过<CALL>标记请求外部帮助。研究表明，损失值可以预测标记的准确性，但某些高损失标记仍可接受。提出的LaCy方法通过选择性学习和委托，显著提高了生成的准确性和效率。

🎯

关键要点

小型语言模型（SLMs）的预训练知识受限于其参数大小，导致生成的内容可能不准确。
SLMs可以通过访问外部资源（如更大的模型、文档或数据库）来缓解这一问题。
研究探讨了SLMs在预训练过程中应学习哪些标记，以及何时通过<CALL>标记请求外部帮助。
损失值虽然可以预测标记的准确性，但某些高损失的标记仍然可以接受，不应触发<CALL>。
使用spaCy语法解析器可以增强损失信号，帮助决定哪些标记应学习，哪些应委托以防止事实错误。
提出的LaCy方法通过选择性学习和委托，显著提高了生成的准确性和效率。

🔎

延伸解读

小型语言模型的局限性

小型语言模型（SLMs）由于参数限制，无法预训练大量世界知识，导致生成内容的准确性受到影响。理解这一局限性有助于开发更有效的模型，尤其是在需要高准确性的应用场景中。

外部资源的利用

SLMs可以通过访问更大的模型或数据库来提高生成的准确性。这种方法不仅能缓解知识不足的问题，还能在实际应用中提升模型的表现，尤其是在信息量大的任务中。

损失值与标记选择

虽然损失值可以预测标记的准确性，但并非所有高损失标记都需要触发外部请求。理解哪些标记可以接受，有助于优化模型的学习过程，避免不必要的资源消耗。

LaCy方法的优势

LaCy方法通过选择性学习和委托，显著提高了生成的准确性和效率。这一方法的提出为小型语言模型的训练提供了新的思路，尤其是在资源有限的情况下，具有重要的实用价值。

❓

延伸问答

小型语言模型（SLMs）在预训练过程中应该学习哪些内容？

SLMs在预训练过程中应学习哪些标记，以及何时通过<CALL>标记请求外部帮助。

LaCy方法如何提高小型语言模型的生成准确性？

LaCy方法通过选择性学习和委托，显著提高了生成的准确性和效率。

损失值在SLMs的学习中有什么作用？

损失值可以预测标记的准确性，但某些高损失标记仍然可以接受，不应触发<CALL>。

如何使用spaCy语法解析器来增强SLMs的学习？

使用spaCy语法解析器可以增强损失信号，帮助决定哪些标记应学习，哪些应委托以防止事实错误。

小型语言模型的知识受限于什么因素？

小型语言模型的预训练知识受限于其参数大小，导致生成的内容可能不准确。

SLMs如何通过外部资源来改善生成内容的准确性？

SLMs可以通过访问外部资源，如更大的模型、文档或数据库，来缓解生成内容不准确的问题。

🏷️