AI 范式雷达:《Agent安全新范式:从静态对齐到动态诊断护栏》
Micropaper
·
RVPO:通过方差正则化实现风险敏感的对齐
Apple Machine Learning Research
·
个性化群体相对策略优化用于异质偏好对齐
Apple Machine Learning Research
·
一分钟读论文:《安全对齐的副作用:AI 为何拒绝帮助网络防御者》
Micropaper
·
关于智能与判断不可分割性的探讨:AI对齐中过滤的计算不可行性
Apple Machine Learning Research
·
AMUSE:用于代理多说话者理解的音视频基准与对齐框架
Apple Machine Learning Research
·
CAR-Flow:条件感知重参数化对齐源和目标以实现更好的流匹配
Apple Machine Learning Research
·
语言模型微调的简要总结
Stack Overflow Blog
·