本文提出了一种基于Mimic Score的新数据选择方法,旨在优化大规模网络数据集中的样本选择,以提高数据效率。该方法通过参考模型权重评估样本质量,并在六个图像数据集上实现了性能提升。
本研究解决了现有去中心化学习方法中常量梯度截断界限和固定级别差分隐私噪声导致的准确性下降问题。提出的Dyn-D$^2$P方法根据梯度收敛动态调整梯度截断界限和噪声水平,从而在保证隐私的同时提高模型准确度。实验结果表明,这一方法在强隐私保证下显著优于采用固定级别噪声的对手,且首次为动态梯度截断界限和噪声水平下的差分隐私去中心化非凸优化提供了可证明的效用界限。
本研究针对现有检索增强生成(RAG)方法评估中的不足,提出了新的自动化评估方法,以信息增益为视角来测量检索质量。具体而言,我们引入了语义困惑度(SePer)这一指标,量化检索对减少语义困惑度的有效性,实验证明SePer与人类偏好高度一致,并在多种RAG场景中提供更精准高效的检索效用评估。
本研究解决了角色扮演对话代理在角色表现效用与内容安全之间的平衡问题。论文提出了一种新颖的自适应动态多偏好(ADMP)方法,根据风险耦合的程度动态调整安全和效用的偏好,并引入耦合边际采样(CMS)来增强模型处理高风险场景的能力。实验结果表明,该方法在提高安全指标的同时保持了效用。
本研究提出了一种LED合并框架,旨在解决大型语言模型微调中的安全性与效用之间的冲突。该框架通过识别关键神经元和隔离冲突更新,降低有害响应率,同时保持高效能,提供轻量级的多任务模型解决方案。
本研究探讨了半值数据估值中效用对结果一致性的影响,揭示了数据、半值权重与效用之间的复杂关系,并提出了空间特征概念,为分类效用提供几何解释。
本文探讨了AI信任值与决策者自信度之间的对齐程度对AI辅助决策效用的影响。研究表明,提高AI信任值与人类预测自信度之间的对齐可以显著提升决策质量,且通过后处理AI信任值来实现多校准的方法有效增加了二者的对齐度和决策效用。
本研究探讨了训练大型语言模型时数据质量、数量与来源多样性的平衡,提出了UtiliMax和MEDU两种新方法,显著提升训练效率并降低计算需求,具有广泛的应用潜力。
本研究探讨了图像分类中的公平性、隐私与效用之间的权衡,分析了尖锐性感知训练与差分隐私的结合,发现泛化技术可能加剧模型偏见,影响准确性和隐私安全。
本文探讨了机器学习中去除已训练模型数据的技术问题,提出了一种新的强健梯度下降变体,显著降低了去学习的时间复杂性,尤其在处理不同样本时表现突出。
本研究提出HARec框架,通过双曲空间对齐用户-物品信息与文本描述,解决推荐系统中用户接触内容的限制,实现探索与利用的平衡。HARec在效用和多样性方面显著优于现有方法。
本研究探讨在线大语言模型交互中的隐私保护与文本清理之间的矛盾,提出利用小型语言模型评估清理效果,以降低资源损失,并指出基于差分隐私的清理技术存在明显缺陷。
本研究提出了一种新的高维截断拉普拉斯机制,解决了现有私有词嵌入方法在高隐私环境下效率低的问题。该方法方差更低,实验显示在高隐私下效用仅略微下降,实现了隐私保护与实用性的平衡。
研究提出“监狱破解解药”方法,通过调整大型语言模型内部状态的稀疏子集来提高安全性,实验表明调整约5%的状态即可有效。其他方法如ReNeLLM框架和SafeDecoding策略也在探索增强模型安全性。
本研究针对大型语言模型(LLM)在真实与效用目标之间的冲突问题进行了探讨,具体揭示了在多轮互动情境中,如何应对这些矛盾。提出的AI-LieDar框架通过设计真实场景,评估模型在满足目标时的真实表现,发现所有模型的真实率不足50%。这一发现突显了LLM真实性复杂性,并强调了确保其安全可靠部署的进一步研究必要性。
本研究提出了一种名为INTRA的方法,通过对比学习只依赖外观图进行特征识别,消除了配对数据集的需求,并结合视觉-语言模型嵌入,可以灵活生成文本条件下的效用图。实验结果表明,该方法在多个数据集上表现优异,并在新交互和物体的效用扎根方面具有显著的领域可扩展性。
该文章介绍了COLOSSEUM,一个用于评估机器人在不同环境扰动下性能的新模拟基准测试。研究发现,四种最先进的操作模型在环境扰动下的成功率下降了30-50%,同时应用多个扰动时下降≥75%。改变干扰对象的数量、目标对象的颜色或照明条件是降低模型性能的主要因素。研究结果与真实实验中的类似扰动相关。该研究公开了COLOSSEUM的使用代码,并发布了用于复制真实世界扰动的三维打印对象的代码。希望COLOSSEUM能成为评估操作泛化能力的基准。
本研究探讨了分布式多臂赌博设置在流言传播模型中的应用。研究者们介绍了几种动力学,并展示了与乘性权重更新算法的关系。他们还开发了一个通用框架来分析这些自然协议的种群水平遗憾。研究结果表明,在广泛的参数范围下,可以推导出次线性遗憾界。此外,当奖励分布是由随机梯度量规产生时,这些协议可以近似地优化面对单纯形的凸函数。
本研究针对合成数据在分析任务中应用时质量不足的问题,提出了一种基于密度比估计的质量评估方法。该框架与现有评估措施相关联,提供了易于理解的全局和局部效用度量,且通过模拟实验验证了其在估计全局效用方面的准确性。研究结果表明,该方法在合成数据生成工作流程中具有重要价值,并已通过开放源代码R包提供实现。
机器学习模型解释学与深度人工神经网络同步增长。研究提出实用解决方案,建议关注机器学习解释的实用性。提出五种用例,并描述可依靠客观经验测量和可证伪假设的伪实验。该实验方法对XAI领域的科学知识贡献必要。
完成下面两步后,将自动完成登录并继续当前操作。