本研究提出了一种新的后处理方法,通过优化基于中心的回归损失,减轻面部识别系统在不同人群中的偏差。结果表明,该方法在提高公平性的同时,保持了全球准确性。
本研究探讨了分布外(OOD)检测中语义转变的模糊性,提出了明确的语义空间和协变量空间定义,并定义了“可处理的OOD”设定,以确保后处理方法能有效区分OOD和ID分布。
最近研究表明,文本到图像扩散模型在生成高质量图像时存在记忆训练数据的问题,可能引发版权和隐私风险。本文探讨了交叉注意力机制与记忆现象的关系,并提出了一种后处理方法,通过剪枝特定子空间的权重来减轻记忆问题,同时保持生成图像的质量和模型的效率。此外,研究分析了影响记忆行为的因素,并提出了新的检测和解决方案。
该论文研究了多种检索增强语言模型的优缺点,提出了“rethinking with retrieval”(RR)后处理方法,以改善推理性能。通过构建新的通识语料库和检索策略,提出的统一框架(RACo)在多个推理任务中表现优异。此外,研究揭示了大型语言模型在处理冗余信息时的局限性,建议未来训练中应纳入相关数据以提升性能。
本文探讨了通过树搜索框架提升大型语言模型(LLMs)推理能力的方法。提出的BoT和ToT框架显著提高了模型在复杂问题解决中的表现,尤其在数学、益智游戏和数独等任务上。此外,引入的后处理方法RR和概率思维树推理进一步改善了模型在常识推理和复杂问答中的性能。
我们开发了一个基于卷积神经网络的组织和笔迹分割模型,通过对200张H&E染色WSI数据集的训练,在组织分割和笔迹分割方面取得了较高的准确性。我们还提出了一种基于聚类的后处理方法,用于分离交叉部分,并证明该方法对于常见的玻片和扫描伪影具有鲁棒性。我们将经过训练的模型参数和后处理方法以SlideSegmenter的Python软件包公开发布。
本文研究了多分类情况下实现公平性的问题,并扩展了基于后处理方法的方法,以实现机器学习分类器的公平性。实验发现,该方法在数据集中个体数量较高时,精度下降微不足道,且能强制实施公平。
该研究提出了一种基于人类编程阶段的生成和编辑方法,以提高大型语言模型在竞争性编程任务方面的代码质量。研究评估了9种常见代码生成LLM在两个竞争性编程数据集上的表现,结果显示该方法在APP-dev、APPS-test和HumanEval上的表现均优于其他后处理方法。
该研究提出了一种基于人类编程阶段的生成和编辑方法,用于提高大型语言模型在竞争性编程任务方面的代码质量。该方法在两个竞争性编程数据集上的表现均优于其他后处理方法,平均提高了89%、31%和48%。
完成下面两步后,将自动完成登录并继续当前操作。