该研究提出了一种隐式正则化方法用于Fréchet回归,解决了变量选择不足的问题。该方法能够捕捉预测变量与响应之间的非线性互动,同时提高模型的稀疏性和选择一致性。
本文提出了一种稀疏梯度下降(Sp-GD)方法,旨在解决凸分段线性回归中的变量选择和参数估计精度问题。研究表明,在足够的数据支持下,Sp-GD能够准确恢复模型参数,显示其在高维数据分析中的应用潜力。
本文提出了一种基于最大均值差异(MMD)的双样本检验方法,分析了在样本选择偏差和高维情况下的统计检验能力。研究了MMD在ε污染下的估计问题,并提出了改进的估计方法,展示了其在变量选择和神经网络检验中的应用,强调了方法的有效性和统计功率。
该论文探讨了稀疏组套索惩罚与深度神经网络的结合,以解决非参数高维问题。研究表明,深度神经网络在求解非线性偏微分方程时能够生成稀疏且准确的解,并通过对抗性训练提高了估计器的收敛性和性能。此外,提出了基于偏导数的非参数稀疏模型,展示了其在变量选择中的优越表现。
本文探讨了生态数据空间预测中的变量选择和验证策略,强调了“随机森林”算法的重要性。研究指出,高度自相关的变量可能导致过拟合,从而影响预测准确性。提出了空间预测误差剖面和空间变量重要性剖面作为新工具,以改善模型的解释和设计。同时,讨论了地理空间机器学习模型的评估挑战及其改进方法。
本文研究了随机森林在高维物质研究中的预测建模和变量选择方面的适用性。通过两个模拟研究,评估了Vita和Boruta变量选择程序的效果。结果表明,超参数的适当设置取决于数据中的相关结构,超参数的默认值并非总是适合于识别重要变量。因此,适当的取值因研究的目标是否在于优化预测性能或变量选择而异。
完成下面两步后,将自动完成登录并继续当前操作。