小红花·文摘

机器之心数据服务现已上线，提供高效稳定的数据获取，简化数据爬取流程。

精确捕捉疾病进程中细胞动力学变化，生成式平台UNAGI准确模拟药物扰动

机器之心 ·

本研究解决了大型语言模型（LLMs）在代码理解和推理中的脆弱性问题。通过提出CodeCrash基准，研究评估了LLMs在代码结构和文本干扰下的鲁棒性，揭示了其在面对结构性噪声时的脆弱性和对自然语言线索的依赖。研究结果强调了LLMs在代码执行和理解方面的关键鲁棒性问题，并为未来的评估和基准测试提供了可行方向。

CODECRASH：在结构和语义扰动下对大型语言模型推理的压力测试

BriefGPT - AI 论文速递 ·

本研究提出了一种自适应KV缓存合并方法KeepKV，旨在解决大型语言模型推理中的KV缓存膨胀问题，以确保高效性能和注意力一致性。

KeepKV：消除KV缓存压缩中的输出扰动以提高大规模语言模型推理效率

BriefGPT - AI 论文速递 ·

本研究探讨了DP-SGD训练中噪声对梯度方向的负面影响，提出了几何扰动策略GeoDP，显著提高模型效率，减少方向噪声，同时确保隐私保护。实验结果表明，该方法在多个数据集和模型上均有效。

技术报告：分析和优化 DP-SGD 扰动的完整版本

BriefGPT - AI 论文速递 ·

本研究针对多模态大型语言模型在密集图像描述中的幻觉问题，提出了新指标HalFscore来评估描述质量，并通过对抗性扰动文本提升生成描述的真实性。

PerturboLLaVA：通过扰动视觉训练减少多模态幻觉

BriefGPT - AI 论文速递 ·

本研究解决了时间序列分类模型解释性不足的问题，揭示了扰动评价法在不同类别间的显著差异，并提出了带类感知惩罚项的评估框架，以更准确地评估特征归因效果。

评估时间序列归因中的类依赖扰动效应

BriefGPT - AI 论文速递 ·

本研究针对自然语言处理（NLP）系统易受对抗攻击的脆弱性，提出了一种新的攻击方法——情感攻击（Emoji-Attack），该方法通过操控表情符号实现细微、有效的扰动。与传统的连续字符或单词级策略不同，情感攻击以表情符号为攻击层次，能够产生不易察觉的变化，从而显著提高对抗攻击的有效性和NLP系统的稳健性。

情感攻击：通过表情符号序列对自然语言处理系统进行零扰动对抗攻击

BriefGPT - AI 论文速递 ·

本研究旨在解决当前机器阅读理解（MRC）模型在真实场景中的鲁棒性评估不足的问题。我们提出了一种框架，通过使用维基百科编辑历史中的文本扰动，自动评估模型在自然扰动下的表现。研究结果表明，最先进的模型在遇到自然扰动时性能下降，提示研究人员关注这种真实的扰动类型，并提出通过训练增强模型的鲁棒性的方法。

关注真实世界的扰动！机器阅读理解中的自然鲁棒性评估

BriefGPT - AI 论文速递 ·

本研究针对大语言模型在微调过程中出现的“双重下降”现象，提出了LoRA-GGPO方法，通过梯度和权重范数生成有针对性的扰动，以优化损失景观的平滑度。这一新方法显著提高了模型的泛化能力，相较于传统的LoRA及其先进变体，LoRA-GGPO在自然语言理解和生成任务中表现更佳，提供了一种高效的微调方案，广泛适用于实际应用。

LoRA-GGPO：通过梯度引导扰动优化缓解LoRA微调中的双重下降

BriefGPT - AI 论文速递 ·

本研究解决了现有变分自编码器在建模基因扰动响应时的可解释性不足问题。提出的GPO-VAE模型通过对齐基因调控网络的参数优化，增强了模型的可解释性，并在多个基准数据集上展示了优越的扰动预测性能。最重要的发现是该模型能够生成与实验验证的调控路径一致的生物学解释性基因调控网络，具有重要的生物学意义和潜在影响。

GPO-VAE：利用GRN对齐参数优化建模可解释的基因扰动响应

BriefGPT - AI 论文速递 ·

本研究提出了一种无关的P-TAME模型方法，旨在解决深度神经网络的可解释性问题。通过辅助图像分类器提取特征，P-TAME能够高效生成高分辨率的解释，效果优于现有方法。

P-TAME：用训练扰动解释任何图像分类器

BriefGPT - AI 论文速递 ·

以推理时间计算换取对抗鲁棒性

OpenAI ·

本研究针对生存分析模型在电子健康记录（EHR）中的敏感性缺乏探索这一问题，提出了一种名为SurvAttack的黑箱攻击框架。该框架结合临床兼容性和语义一致性的细微扰动，显著降低生存模型的预测性能，揭示了患者生存模型的脆弱性，并对医疗质量的提升具有重要影响。

SurvAttack：通过本体引导的电子健康记录扰动进行生存模型的黑箱攻击

BriefGPT - AI 论文速递 ·

本文研究了在边权差分隐私下，发布近似最小生成树的问题，填补了现有算法在计算效率与准确性之间的权衡空白。我们提出了一种新的方法，通过适当的随机扰动输入，使得任何非私密的最小生成树算法的结果能够同时满足隐私性和达到最佳的错误保证。此外，我们建立了与私密Top-k选择的联系，首次得出了最小生成树在近似差分隐私下的隐私-效用权衡下界，展示了我们的误差幅度是最佳的。

通过输入扰动优化私密最小生成树的界限

BriefGPT - AI 论文速递 ·

本文分析了传统评估指标在生成文本质量评估中的不足，特别是在缺乏单一真实值的情况下。研究表明，大型语言模型（如Google Gemini 1）在自动评估方面具有潜力，但与人类评估者的一致性较低，鲁棒性不足，亟需改进。

理解大型语言模型评估在扰动下的鲁棒性

BriefGPT - AI 论文速递 ·

本研究解决了通过因果模型预测扰动效应的问题，识别系统中哪些机制受到外部扰动的影响仍是尚未解决的挑战。提出的生成干预模型（GIM）能够学习扰动特征与原子干预分布之间的映射，从而在未知扰动特征的情况下预测分布变化，并深入理解其在数据生成过程中的机制效应。实验表明，GIM在合成数据和scRNA-seq药物扰动数据上表现出色，能够有效推断扰动机制，超越其他因果推断方法。

因果扰动建模的生成干预模型

BriefGPT - AI 论文速递 ·

本研究针对半监督语义分割中弱-强一致性正则化技术与网络扰动结合不足的问题，提出了一种新的网络扰动方法，以扩展现有的弱-强一致性正则化，特别是针对未标记数据。同时，我们引入了不稳定的标记数据学习过程，开发了一个名为MLPMatch的高效框架，验证其在Pascal VOC和Cityscapes数据集上的先进性能，推动了该领域的发展。

重新审视网络扰动在半监督语义分割中的应用

BriefGPT - AI 论文速递 ·

本研究提出了一种新的对抗攻击策略——区域引导攻击（RGA），旨在利用区域引导图对任意分割模型（SAM）进行扰动，从而提高攻击成功率，揭示其潜在弱点。

区域引导攻击在任意分割模型（SAM）上的应用

BriefGPT - AI 论文速递 ·

本文提出了一种创新方法，解决混合动力汽车在扰动下的受限最优燃料消耗问题。研究中应用了七种训练方法，结果表明六种方法有效应对扰动，优化燃料消耗。

Constrained Optimal Fuel Consumption of Hybrid Electric Vehicles Considering Observational Disturbances

BriefGPT - AI 论文速递 ·

研究提出了一种名为PADL的新方法，解决图像操控检测中生成模型适应性不足的问题。PADL通过对称编码和解码生成特定扰动，降低逆向工程的可能性。实验显示，PADL不仅能准确识别操控区域，还具备更强的推广能力，适用于多种未知生成模型，推动图像安全防护的发展。

扰动、注意、检测与定位（PADL）：强健的主动图像防御

BriefGPT - AI 论文速递 ·