我们提出了一种新方法来评估语言模型的拟合程度,通过分析生成的文本与人类生成文本的统计倾向是否匹配。研究发现神经语言模型只学会了部分倾向,但与经验性趋势相比更接近理论分布。拟合程度取决于模型架构和生成策略。
完成下面两步后,将自动完成登录并继续当前操作。