在本十年后半期,作者认为语言模型已达到优秀水平,现有模型被低估。尽管扩展仍然重要,但过于关注模型能力导致评估指标失真,缺乏有效的比较工具。
作者认为语言模型在本十年后半期已达到优秀水平。
现有的神经语言模型被严重低估,实际上它们在解决一般任务方面表现更好。
尽管扩展仍然重要,但对模型能力的过度关注导致评估指标失真。
目前缺乏有效的比较工具来评估不同模型之间的性能。
完成下面两步后,将自动完成登录并继续当前操作。