小红花·文摘

本研究提出了一种新的训练范式Pre-DPO，旨在提高直接偏好优化（DPO）的数据利用效率。通过使用指导参考模型，Pre-DPO显著提升了DPO和简单偏好优化（SimPO）的性能，无需外部模型或额外数据。

Pre-DPO：通过指导参考模型提高直接偏好优化中的数据利用率

BriefGPT - AI 论文速递 ·

本研究提出了一种新颖的贝叶斯成员推断攻击方法（BMIA），通过贝叶斯推断进行条件攻击，仅需一个参考模型，显著降低计算消耗，提高成员推断的准确性和效率。

Efficient Membership Inference Attacks Based on Bayesian Neural Networks

BriefGPT - AI 论文速递 ·

本研究针对传统的直接偏好优化（DPO）算法在长度偏倚、内存效率和概率下降方面的限制，提出了一种新的长度控制边际偏好优化（LMPO）方法。LMPO通过引入统一的参考模型和平均对数概率优化策略，改善了训练和推理阶段之间的一致性，实验证明其在控制响应长度和减少概率降解方面优于现有技术。

无参考模型的长度控制边际偏好优化

BriefGPT - AI 论文速递 ·

本研究解决了偏好学习中高质量样本获取的困难。通过发现参考模型的概率空间能够自然识别高质量训练样本，提出了一种新的采样策略，显著提高了学习性能，同时减少了训练数据使用量，尤其在技术任务上表现优异。

清晰偏好留下痕迹：基于参考模型的偏好学习采样方法

BriefGPT - AI 论文速递 ·

本文研究了大规模语言模型对齐的主要方法，包括强化学习与人类反馈（RLHF）和直接偏好优化（DPO）。提出的新方法混合偏好优化（MPO）结合了两者的优点，实验验证了其有效性。DPO在无监督语言模型中表现更好且更稳定，RS-DPO方法在资源有限环境中提升了模型一致性。此外，研究还探讨了隐私保护对齐的效果。

了解您的参考模型以实现良好对齐

BriefGPT - AI 论文速递 ·

本文介绍了一种名为直接偏好优化（DPO）的算法，旨在解决无监督语言模型的可控性问题。DPO相较于传统强化学习方法表现更佳且更稳定。此外，研究提出了Diffusion-DPO方法，通过优化扩散模型与人类偏好匹配，显著提高了视觉吸引力和提示对齐。MODPO算法则通过多反馈训练不同模型，提升了生成多样化解决方案的效率。

混合偏好优化：通过数据选择和更好的参考模型进行强化学习

BriefGPT - AI 论文速递 ·

本文介绍了一种名为SHOT的算法，可用于最小化目标模型和参考模型参数之间的距离。该算法适用于任何GBML基线，并已证明其优于对应基线的结果。

SHOT: 抑制优化轨迹上的 Hessian 对于基于梯度的元学习

BriefGPT - AI 论文速递 ·

2023年7月，我国发布了首个工业互联网安全领域的国际标准ISO/IEC 24392：2023《网络安全工业互联网平台安全参考模型》，该标准通过三个视角构建了工业互联网平台安全参考模型，解决工业互联网应用和发展过程中的平台安全问题，指导企业和研究机构设计安全防御措施，增强工业互联网平台的安全性。

我国牵头提出的国际标准《网络安全工业互联网平台安全参考模型》正式发布

FreeBuf网络安全行业门户 ·