该研究提出了一种名为Metric-DST的多样性引导自监督学习策略,旨在解决机器学习中的选择偏差问题。通过引入多样的数据样本,增强模型的鲁棒性,改善模型的公平性。研究表明,Metric-DST在处理选择偏差的生成数据和实际数据集时表现优异。
本文提出了一种基于图的框架FGCE,用于生成群体反事实解释,以审计模型公平性,填补可信机器学习中的空白。该框架考虑现实可行性约束,构建相似反事实子群体,并通过实验验证其有效性。
本文探讨了差分隐私(DP)在神经网络训练中的应用,特别是在处理不平衡类别数据时的挑战。研究发现,DP-SGD算法可能导致模型准确率不公平,并加剧性别、种族和宗教偏见。通过反事实数据增强法,可以在保护隐私的同时改善模型的公平性。此外,研究评估了不同隐私级别对模型公平性的影响,并提出了优化隐私与效用平衡的策略。
本研究提出了一种名为Facade的算法,解决去中心化学习中因数据特征空间异质性导致的模型效用和公平性问题。该算法通过动态聚类分配节点,实现公平训练。实验表明,Facade在模型准确性和公平性上优于现有方法,并降低了通信成本。
本文介绍了反事实文本生成的多种模型和框架,如GYC、DISCO和CREST,探讨了大型语言模型(LLMs)在反事实生成中的应用及其优势。研究显示,LLMs在生成反事实样本方面表现优异,但仍存在局限性。CEval基准评估库的建立旨在统一评估标准,促进社区贡献。未来研究将关注提升模型的稳健性和公平性。
本文介绍了一种基于生成式回放的无监督分割方法GarDA,旨在提升医学影像分析中模型对新类别的分割性能。文章综述了连续学习技术在医学影像中的应用,探讨了面临的挑战与未来发展方向,并强调了模型公平性和内存效率的重要性。
本研究探讨了深度学习模型在医学成像中的应用,强调可解释性机器学习在自动诊断中的潜力。通过多源数据集,提出了半监督学习框架和基于概念瓶颈的预处理方法,改善了分类性能并消除了虚假相关性。同时,研究关注模型公平性和细粒度学习,提出新的评估指标以提升医学影像分析效果。
本研究探讨了大型语言模型中的社会和经济偏见,分析了预训练数据对模型公平性的影响。结果表明,模型存在政治倾向,可能加剧偏见。研究提出去偏方法,以减少性别、种族等刻板印象对文本生成的影响,提高模型的公正性和稳健性。
研究表明,现有语言模型数据集中存在大量重复示例,导致模型输出中超过1%的内容直接复制自训练数据。为提高模型准确性和减少冗余数据,开发了新的去重算法,显著提升了数据识别效果和模型公平性,同时增强了隐私安全性。
大型语言模型偏差指数(LLMBI)是量化和解决大型语言模型中偏见的重要工具。研究构建了LLMBI,通过多个偏见维度的评分系统来衡量和缓解模型的偏见。LLMBI强调了持续监测和校准模型的必要性。
深度学习模型压缩技术在提高人类任务自动化能力方面发挥重要作用。本文综述了量化、知识蒸馏和修剪等方法在生物特征识别应用中的应用,并对其优缺点进行了分析。讨论了模型偏见与模型压缩之间的联系,并提出了改进方法的建议。未来的研究需要将压缩技术引向模型公平性的方向。
完成下面两步后,将自动完成登录并继续当前操作。