高斯分布中具有 Huber 污染的近最优算法:均值估计与线性回归
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本研究探讨了在存在重尾污染的情况下,强鲁棒回归估计器的高维特性。结果表明,优化调整的Huber损失与位置参数δ是次优的,需要进一步正则化以达到最佳性能。此外,研究还导出了岭回归的超额风险的衰减速率。研究展示了公式可以推广到更丰富的模型和数据分布。
🎯
关键要点
- 研究了重尾污染下强鲁棒回归估计器的高维特性。
- 提供了M-估计在无二阶矩情况下的渐近特性描述。
- 优化调整的Huber损失与位置参数δ是次优的,需要进一步正则化以提高性能。
- δ作为样本复杂性和污染的函数存在有趣的转变。
- 导出了岭回归的超额风险衰减速率。
- 有限二阶矩的噪声分布下,岭回归是最佳的,但在二阶矩不存在时衰减速率更快。
- 公式可以推广到更丰富的模型和数据分布,包括混合模型的广义线性估计。
➡️