该研究探讨了深度神经网络中的鲁棒性偏差,提出了公平感知对抗学习(FAAL)和距离感知的公平对抗训练(DAFA)等方法,以解决公平性与鲁棒性之间的矛盾。实验结果表明,这些方法在多个数据集上显著提升了模型的公平性和鲁棒性,减轻了固有偏见。
本研究探讨了数据集和预训练模型中的固有偏见,提出了一种概念漂移方法,通过分析线性探针的权重更新轨迹揭示隐藏偏见。该方法在偏见增强提示下显著改善了零样本性能,展现出广泛的应用潜力。
本文探讨了大型语言模型(如ChatGPT)中的固有偏见,分析了性别和种族偏见的存在及其评估框架GPTBIAS的有效性。研究表明,性别偏见有所减少,但种族偏见依然存在。强调跨学科合作的重要性,以开发更公正和透明的人工智能系统,并提出改进偏见检测和缓解技术的必要性。
本文探讨了利用上下文信息和外部知识提取新闻报道中的利益相关者,应用序列增量聚类算法进行实体聚类,检测固有偏见。研究表明,基于BERT和RNN模型的提取方法显著提高了准确度,提出的KCD方法在政治观点检测中表现优异,促进了跨学科的NLP研究。
完成下面两步后,将自动完成登录并继续当前操作。