小红花·文摘

本文提出了一种基于分布鲁棒性的优化方法——主题条件风险值（topic CVaR），用于解决语言模型在未知测试分布下的性能问题。该方法在广泛的潜在测试分布下表现良好，并且相对于标准最大似然估计法（MLE），在使用 Yelp 评论和新闻混合训练语言模型，并仅在评论数据上进行测试时，实现了 5.5 点困惑度的降低。