本文提出了一种新型机器学习模型,旨在解决数据不足时对子群体因果概率的预测问题。研究表明,采用Mish激活函数的多层感知器模型能够有效预测因果概率,为决策提供支持。
本文针对预测问题中保证不仅在总体人口中有效,同时也适用于有意义的子群体的需求,提出了一种新方法。通过将个体归属到具有不同特征的混合模型组件中,研究了如何为不同子群体提供保证,并通过变分算法实现了对潜在子群体结构的有效处理。结果表明,该方法在子群体不明显分离的情况下也能达到优越的性能。
本研究解决了训练数据与测试数据之间的分布转变对机器学习模型性能的影响,指出现有的重要性加权方法对权重的确定存在次优问题,未考虑样本量对模型估计方差的影响。通过引入偏差-方差权衡的视角,提出了一种双层优化程序,实现权重与模型参数的同时优化,实验证明该方法在深度神经网络最后一层重训练中显著提高了泛化性能。
介绍了CURLS规则学习方法,能够有效描述具有治疗效果的亚群体。CURLS通过平衡治疗效果与方差,考虑规则的可解释性,找到更好的估计效果和减少方差,同时保持准确性和可解释性。
我们提出了一种多群健壮算法,通过设计健壮的学习算法以克服数据损坏,对每个亚群体的健壮性仅随该亚群体内的数据损坏量而降低。这种算法在数据损坏分布不均匀时提供更有意义的健壮性保证,建立了多群公平性和健壮性之间的新联系。
神经网络在偏见数据集上训练时容易学习到偏见相关性,影响泛化和鲁棒性。研究者提出了一种新的去偏方法DeNetDM,通过专家产品的训练范例创建带有偏见和去偏见架构的模型,并通过模型转移生成目标去偏模型。实验证明该方法在三个数据集上取得了约5%的改进,无需偏见标签或注释。此外,该方法有效利用了数据中的多样性点,超越了以前的方法。
该研究评估了基于大型语言模型的子群代表模型的能力,发现在语境学习下的表现对不同人口统计学子群的效果不同。这对从业者和决策者提出了挑战,需要获得精细化的基准测试数据来考虑保真度和泛化能力。
本文提出了子群体中的因果推断问题(s-ID),解决了只能访问目标子群体的观测数据的限制。作者提出了必须满足的因果图条件,并提出了一个完备可靠的算法。
完成下面两步后,将自动完成登录并继续当前操作。