该研究探讨了大型语言模型(LLMs)的语言表示及其在推理和生成连贯思维链条中的能力。通过均场理论分析,发现语言流形的线性可分性与模型特性相关。研究提出了一种新模型,结合句法和概率方法,旨在提升语言理解和生成能力,并分析了信息编码与模型大小的关系。
本文探讨了深度学习与自然语言处理在构造语法研究中的协同关系,分析了大型预训练语言模型的性能,并提出未来研究建议。研究强调构造语法在语言表示中的重要性,展示其在自然语言理解任务中的优势。
该文介绍了一种基于图到图的 Transformer 模型架构,将图的边作为输入用于注意力权重计算,并使用类似于注意力的函数预测图中的边,从而将显式图集成到预训练的 Transformer 模型中学习出的潜在图中。
完成下面两步后,将自动完成登录并继续当前操作。