本研究探讨了在批量二元决策中使用近似后验概率导致的超额风险问题,提供了校准前后遗憾的上下界公式,并识别了不同情况下的决策改进策略,表明多重校准方法能有效降低训练成本。这些策略在自然语言处理任务中对于收益与成本的平衡至关重要。
本文探讨了基于经验风险最小化与l_1正则化的深度神经网络在回归和分类中的超额风险界限。研究表明,深度学习在弱相关观测下具有鲁棒性,尤其在无界损失函数和输入输出情况下。通过理论分析,提出了深度神经网络的期望超额风险与数据矩的关系,并验证了鲁棒估计器在重尾误差模型中的优越性。
本研究提出了一种在再生核希尔伯特空间中修正最小二乘学习算法误差的方法,以解决训练数据与未来数据分布不一致的问题。通过理论分析和数值研究,验证了该方法在高维核岭回归中的有效性,揭示了偏差和方差对核回归风险的影响,并提供了统一的理论框架以界定核回归的超额风险。
本文提出了一种基于样本拆分的元算法,结合正交随机森林和非参数校准方法,以提高回归模型的估计精度和校准性能。实证分析表明,该算法在处理复杂干扰参数时有效,并能在高维变量集下控制超额风险。
本论文提供了一种统一的理论来上界核回归的超额风险,并揭示了核矩阵的特征值尾部分布形成一种隐式正则化现象,从而实现良好的泛化。该研究结果适用于高输入维度的良性过拟合、固定维度的近似过拟合以及正则化回归的明确收敛速率。
本文研究了带权最近邻分类器的超额风险和非负权重的渐近最优向量,结果表明该分类器的遗憾与未加权的k-最近邻分类器相比,仅与特征向量的维度有关。同时,在更大的维度上,权重最优。研究还证明,当允许使用负权重时,强平滑假设是可能提高收敛速度的。实证对比支持了本文的结果。
该研究探讨了存在重尾污染的高维情况下,强鲁棒回归估计器的特性。研究发现,需要进一步正则化以达到最佳性能。此外,研究还导出了岭回归的超额风险的衰减速率。公式可以方便地推广到更丰富的模型和数据分布。
完成下面两步后,将自动完成登录并继续当前操作。