本研究提出了一种风险评估与缓解框架,旨在解决Retrieval Augmented Generation(RAG)在自然语言处理中的安全和隐私问题。该框架结合了RAG特定的安全考虑与现有安全指南,以指导安全合规的RAG系统实施。
本研究探讨了大型语言模型(LLMs)在代码生成中产生的幻觉问题,分析了幻觉的类型,评估了现有的基准测试和缓解策略,指出了当前面临的挑战,并提出了未来的研究方向建议。
本研究探讨了生成型人工智能(GenAI)代理在企业环境中的安全挑战,提出了全面的威胁模型,识别了9种主要威胁。文章强调了代理的自主性和复杂性带来的新风险,并提供了ATFAA和SHIELD框架以降低企业风险。
本研究探讨了机器学习算法在推理中对抗性输入的检测与缓解的关系,定义了“检测防御”和“缓解防御”。研究发现,在生成学习任务中,两者存在明显差异,某些情况下只能通过缓解实现防御,且缓解阶段所需样本显著少于初始训练样本。
本研究探讨了深度学习模型推理过程中的不一致性和错误,提出了新的检测和测量方法,并介绍了针对训练数据偏见的采样和合成数据生成技术,以提升模型在复杂任务中的表现,增强其鲁棒性、公平性和可解释性。
本研究探讨了基准数据污染对大规模语言模型评估的影响,并系统性检验了现有缓解策略的有效性。结果表明,现有策略未能显著提高抵御污染的能力,强调了设计更有效缓解策略的必要性。
本研究针对长文本生成中的“失落中间”问题,提出了长输入输出基准(LongInOutBench)和合成数据集,开发了检索增强长文本生成器(RAL-Writer),显著提升了长输入和长输出任务的生成效果。
本研究提出了一种统计鲁棒的WDRO框架,以解决Wasserstein分布鲁棒优化中的鲁棒过拟合问题。该框架结合了对抗噪声的Wasserstein距离和统计误差的Kullback-Leibler散度,显著提升了对抗性能,推动了鲁棒优化理论的发展。
本研究提出了一种振动辅助的滞后补偿方法,旨在解决微创手术中腱鞘机制的滞后问题。通过施加受控振动,滞后显著降低,实验结果显示RMSE降低23.41%。结合时间卷积网络模型,MAE减少85.2%,为机器人应用提供了有效解决方案。
本研究针对医学大型视觉语言模型(Med-LVLMs)生成幻觉的问题,提出了MedHEval基准,评估幻觉的三种根本原因及其缓解策略。结果表明,现有策略效果有限,需要改进训练以提升模型的可靠性。
本研究探讨了脉冲神经网络(SNN)与人工神经网络(ANN)转换中的性能损失问题。引入两相概率脉冲神经元(TPP),研究表明随机脉冲重排列能够提升SNN性能,实验证明其在多个数据集上表现优异。
本研究提出了一种基于可解释人工智能的框架,旨在检测和缓解医疗领域深度神经网络中的误导性模型行为。通过样本和像素级的数据标注,成功识别并减轻了偏见,从而提高了模型在实际医疗任务中的鲁棒性。
本研究探讨了大型语言模型(LLMs)在隐私泄露、幻觉输出和价值失调等方面的内在风险及其恶意使用现象。论文提供了一个统一框架,综述了针对这些问题的缓解策略,涵盖数据收集、预训练、微调、推理及后处理的最新进展,旨在提升LLMs在隐私保护和减少幻觉等方面的表现。
本研究提出了一种基于能量和极化的在线无线频率干扰(RFI)抑制方案,旨在提高无线电干涉仪的数据处理效率。该方法通过实时检测低占空比或瞬态RFI,增强了对干扰的抑制能力。
本研究提出了一种稀疏训练策略,旨在解决多任务学习中的梯度冲突问题。通过部分参数更新,稀疏训练有效减轻了梯度冲突,提高了模型性能,并可与现有技术结合使用。
本研究分析了深度学习模型在图像识别中的后门攻击,并评估了现有缓解策略的有效性。通过基准测试16种方法,发现保护效果存在显著差异,并提出了未来改进防御机制的方向。
本研究探讨了自然语言处理中的偏见检测与减轻方法,特别是在机器翻译领域。分析表明,现有研究主要集中于少数语言,未来应扩大研究范围以提高多样性。
本研究提出了FairLoRA,一种通过最小化每类损失方差来缓解视觉模型中的偏见的方法。研究表明,缓解偏见的高秩并不普遍适用,需考虑预训练模型、数据集和任务等因素,并强调使用多种公平性指标进行全面评估的重要性。
本研究探讨手语技术中的偏见问题,分析ASL Citizen数据集的参与者人口统计和词汇特征。结果显示,多种技术能有效减少偏见且不影响准确性,并发布了参与者人口统计信息以支持未来研究。
完成下面两步后,将自动完成登录并继续当前操作。