小红花·文摘

在键盘前保持强健：预防软件开发者的身体疲劳

DEV Community ·

本研究解决了检索增强生成（RAG）系统在面对不可靠检索及知识库时的劲度问题，提出了一种名为强健微调（RbFT）的新方法。通过两项针对性的微调任务，RbFT显著提高了RAG系统在多种检索条件下的鲁棒性，同时保持了高效的推理能力和与其他鲁棒性技术的兼容性。

RbFT：针对检索缺陷的检索增强生成的强健微调

BriefGPT - AI 论文速递 ·

本研究针对现有多模态迷因审查中缺乏高质量仇恨言论数据集的问题，提出了两个新颖的多模态仇恨言论数据集MHS和MHS-Con，以捕捉细粒度的仇恨抽象。通过引入SAFE-MEME框架，该框架结合问答式推理和层次分类，实现了对迷因中仇恨言论的强健检测，实验结果显示其在多个基准上均有显著提升，尤其在处理混淆案例时表现出色。

SAFE-MEME：强健仇恨言论检测的结构化推理框架

BriefGPT - AI 论文速递 ·

冬泳成为我的新爱好，经过几次尝试，我逐渐适应低温，身体变得更强，能在水中待更久。计划周末和周三进行冬泳。

折返点 2448 气温1度水温6度

conge ·

研究提出了一种集成机器学习模型，通过多样化梯度和高置信度边界实现可证书鲁棒性。通过多模型平滑策略，证明集成模型在一定条件下优于单一模型。引入轻量级多样性正则化训练，提升了模型在MNIST、CIFAR-10和ImageNet数据集上的L2鲁棒性。

LOTOS：用于训练强健集成的逐层正交化

BriefGPT - AI 论文速递 ·

提出了一种基于安全聚合协议的强韧联邦学习框架（RFLPA），通过计算本地更新和服务器更新之间的余弦相似度来进行鲁棒聚合。利用可验证的打包Shamir秘密共享降低通信成本，设计点积聚合算法解决信息泄露问题。实验结果显示，RFLPA在保持准确性的同时减少了75％以上的通信和计算开销。

Celtibero: 针对联邦学习的强健层次聚合

BriefGPT - AI 论文速递 ·

自主集成对抗训练方法在不同训练时期通过集成模型，如模型权重平均化（WA），提高模型的健壮性。然而，先前的研究表明，对抗训练中的自主集成防御方法仍然存在健壮过拟合问题，严重影响泛化性能。为解决这个问题，本文目的在于解决权重空间异常值的影响，提出了一种易于操作且有效的中位数集成对抗训练（MEAT）方法，通过搜索历史模型权重的中位数来解决自主集成防御中存在的健壮过拟合现象。实验结果表明，MEAT...

MEAT: 提高强健性和泛化能力的中值集成对抗训练

BriefGPT - AI 论文速递 ·

我们研究了具有 s - 矩形不确定性的稳健马尔可夫博弈。我们展示了 s - 矩形稳健马尔可夫博弈的稳健纳什均衡和适当构建的正则化马尔可夫博弈的纳什均衡之间的一般等价性。该等价结果为解决 s - 矩形稳健马尔可夫博弈提供了一个规划算法，并对使用正则化方法计算的策略提供了可证明的稳健性保证。然而，我们证明即使对于只有奖励不确定性的二人零和矩阵博弈，计算稳健纳什均衡也是 PPAD...

捆绑不确定性：强健性和正则化在马尔科夫博弈中

BriefGPT - AI 论文速递 ·

大语言模型在旅行规划领域有着显著的实际应用，通过 LLM 模块化框架的操作，对 LLMs 的推理能力进行改进，并在基线性能上取得了 4.6 倍的提升。

近期的深度学习研究在有界的损失函数或 (亚) 高斯或有界输入的情况下建立了深度神经网络估计器的一些理论性质。本文考虑了从弱相关观测中进行鲁棒深度学习，涉及无界的损失函数和无界的输入 / 输出。仅假设输出变量具有有限的 r 阶矩，其中 r>1。在强混合和 ψ- 弱相关假设的情况下，建立了深度神经网络估计器的期望超额风险的非渐近界限。我们推导出了这些界限与 r 之间的关系，并且当数据具有任意阶的矩 (即 r =∞) 时，收敛速度接近于一些著名结果。当目标预测函数属于具有足够大平滑指数的 H"older 平滑函数类时，期望超额风险的速率对于指数强混合数据接近于或与使用独立同分布样本获得的速率相同。我们考虑了鲁棒非参数回归和鲁棒非参数自回归的应用。对于具有重尾误差的模型的模拟研究表明，具有绝对损失和 Huber 损失函数的鲁棒估计器优于最小二乘法。

在键盘前保持强健：预防软件开发者的身体疲劳

RbFT：针对检索缺陷的检索增强生成的强健微调

SAFE-MEME：强健仇恨言论检测的结构化推理框架

折返点 2448 气温1度水温6度

LOTOS：用于训练强健集成的逐层正交化

Celtibero: 针对联邦学习的强健层次聚合

MEAT: 提高强健性和泛化能力的中值集成对抗训练

捆绑不确定性：强健性和正则化在马尔科夫博弈中

LLM-Modulo 框架下的强健计划：旅行计划案例研究

弱相关数据的强健深度学习

正则化 Q 学习通过强健平均化

揭示稳健性在评估因果推断模型中的潜力

关于强健的过拟合：对抗训练引起的分布问题

探索用于提升集成强健性的模型学习异质性

在键盘前保持强健：预防软件开发者的身体疲劳

RbFT：针对检索缺陷的检索增强生成的强健微调

SAFE-MEME：强健仇恨言论检测的结构化推理框架

折返点 2448 气温1度 水温6度

LOTOS：用于训练强健集成的逐层正交化

Celtibero: 针对联邦学习的强健层次聚合

MEAT: 提高强健性和泛化能力的中值集成对抗训练

捆绑不确定性：强健性和正则化在马尔科夫博弈中

LLM-Modulo 框架下的强健计划：旅行计划案例研究

弱相关数据的强健深度学习

正则化 Q 学习通过强健平均化

揭示稳健性在评估因果推断模型中的潜力

关于强健的过拟合：对抗训练引起的分布问题

探索用于提升集成强健性的模型学习异质性

折返点 2448 气温1度水温6度