本文提出了一种新颖的度量方法——最大子群差异(MSD),有效解决了经典度量方法在偏见评估中的高样本复杂度问题。MSD以线性样本复杂度评估特征子群的偏差,并提供实用算法和修复路径,实证结果表明其优于其他方法。
本研究提出了一种新框架MCCE,克服了因果概念效果解释方法在缺失概念时的局限性。实证结果表明,MCCE在因果效果估计方面优于现有方法。
本研究提出了一种通过对称正定矩阵参数化的学习方法,解决了最优传输理论在源数据和目标数据点概率分布之间定义距离时的不足。实证结果表明所学度量在最优传输基础的领域适应中具有良好效果。
该研究探讨了遥感监督框架下的命名实体识别,发现现有方法效果不佳。为解决标签噪声问题,引入了一种基于课程的正负无标记学习方法,实证结果显示其能力超越现有方法。
本研究提出了一种新的方法和算法,用于处理具有上下级变量耦合的约束双层优化问题。该算法基于近端Lagrangian值函数,将原始问题转化为具有平滑约束的等价优化问题。实证结果验证了该算法在实际性能上的优越性。
本论文研究了使用深度神经网络解决多元时间序列插补问题。通过添加知识驱动的增强,包括投影时间注意力、全局自适应图卷积和Fourier插补损失,使得模型适用于多种插补问题。案例研究证明了该模型的可解释性和实证结果的有效性。
该文介绍了一种名为HyperAttention的近似注意力机制,用于解决大型语言模型中使用的复杂长上下文所带来的计算挑战。实证结果表明,HyperAttention优于现有方法,在不同长上下文数据集上的实证性能表现良好,能够实现5倍的加速。
本文介绍了最小贝叶斯风险(MBR)解码的方法,该方法选择具有最低风险的输出,为NLP模型提供了额外的理论依据。文章还给出了在NLP模型中应用MBR的理论和实证结果,并提出了该领域的未来方向的具体建议。
完成下面两步后,将自动完成登录并继续当前操作。