小红花·文摘

该研究探讨了语言模型参数估计中的计算问题，分析了噪声对比估计与负采样的异同，指出遮蔽语言模型成功的原因在于其建模高阶词共现统计的能力。研究发现，LSTM和Transformer模型在低概率情况下低估目标语言序列的概率，并提出了目的论方法，强调在此情况下使用模型的谨慎。此外，研究还提出了新技术以改善模型性能，并解决概率校准问题。

估算语言模型中稀有输出的概率

BriefGPT - AI 论文速递 ·

本文探讨了噪声对比估计中负面案例的重要性，提出了硬负面案例的有效性，并开发了分析工具以减少误差。研究介绍了新的对抗噪声视图和基于元学习的对比学习方法，强调数据增强在提高模型性能中的作用，并分析了对比学习的鲁棒性及其对采样偏差的容忍度。

对比学习的数据增强是对正激励噪声的估计

BriefGPT - AI 论文速递 ·