大型语言模型的计数能力与分词的影响 发表于:2024-10-25T00:00:00Z。 本研究探讨了大型语言模型在计数任务中的固有架构限制,尤其是分词方式对计数能力的影响。通过理论分析和实验验证,我们发现分词选择显著影响LLMs的表现,并提出新分词方法的潜在设计,以增强其推理能力。 大型语言模型