小红花·文摘 - 小红花技术领袖俱乐部

什么样的偏好，才叫好的偏好？——揭秘偏好对齐数据的「三驾马车」

什么样的偏好，才叫好的偏好？——揭秘偏好对齐数据的「三驾马车」

机器之心 ·

面向数据中心的RLHF：偏好数据集比较的简单指标

面向数据中心的RLHF：偏好数据集比较的简单指标

Apple Machine Learning Research ·