高维重尾数据下的健壮回归:渐近性和普适性
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
该研究探讨了存在重尾污染的高维情况下,强鲁棒回归估计器的特性。研究发现,需要进一步正则化以达到最佳性能。此外,研究还导出了岭回归的超额风险的衰减速率。公式可以方便地推广到更丰富的模型和数据分布。
🎯
关键要点
- 研究探讨了在重尾污染情况下的强鲁棒回归估计器的高维特性。
- 针对无二阶甚至更高阶矩不存在的椭圆形协变量和噪声数据分布,提供了 M - 估计的锐性渐近特性描述。
- 强调了在存在重尾噪声的高维情形中,优化调整的 Huber 损失与位置参数 δ 是次优的,需进一步正则化以达到最佳性能。
- 导出了岭回归的超额风险的衰减速率,指出有限二阶矩的噪声分布下岭回归是最佳的,但协变量的二阶矩不存在时衰减速率可能更快。
- 公式可以推广到更丰富的模型和数据分布,如对混合模型的任意凸正则化训练的广义线性估计。
➡️