BriefGPT - AI 论文速递 ·

3D - 属性：DPO 的挑战和前进路径

📝

内容提要

通过对 Direct Preference Optimization（DPO）的实证研究和与 RLHF-PPO 的系统比较，我们发现 DPO 的三个学习结果特征，即被拒绝回应的概率剧烈下降、LLM 的退化以及对未见回应的扩散效应。在此基础上，我们提出了简单的正则化方法来缓解这些问题，提高 DPO 的训练稳定性和最终性能，同时研究配对偏好数据分布对 DPO...

➡️

继续阅读

【身份与访问控制工程】OAuth 2.1 与 PKCE：现代授权主路径
某团队的单页应用在安全审计中发现access_token以URL fragment形式暴露，存在高风险。审计指出，攻击者可通过浏览器历史和日志获取toke...
【身份与访问控制工程】风险感知认证：设备信任、异常登录与挑战升级
传统认证系统存在安全隐患，风险感知认证（RBA）和自适应多因素认证（Adaptive MFA）通过动态评估风险来提升安全性。RBA根据用户行为、设备和地理...
Christophe Pettus: Hints, Part 3: Advice, Not Orders
Robert Haas’s pg_plan_advice patch set, proposed for PostgreSQL 19, is where ...
Moving past bots vs. humans
As AI assistants and privacy proxies challenge the capabilities of traditiona...
OPPO Pad mini 体验：小小的很全能，塞进口袋的大手机
OPPO于4月21日推出了OPPO Pad mini小平板，主打便携性和阅读体验。该平板配备8.8英寸高刷屏和8000mAh电池，支持OPPO Penci...
SpaceX的首次公开募股是对太空未来的万亿美元赌注
SpaceX即将上市，吸引投资者关注。尽管公司估值超过1万亿美元，但太空经济的盈利前景仍不明朗。专家对太空旅游和资源开采等商业模式持谨慎态度，认为短期内缺...