小红花·文摘

该研究提出AlignDiff框架，显著提高相机校准的角度估计准确性，减少约8.2度的角误差，优于现有方法。

BriefGPT - AI 论文速递 ·

该文介绍了一种利用偏好建模和强化学习方法优化语言模型的技术，能够提高自然语言处理的评估表现。通过迭代在线模式的训练，每周使用新的人类反馈数据更新偏好模型和强化学习策略，有效改进了数据集和模型。同时，研究了强化学习从人类反馈中学习的鲁棒性和重要性，并提供了使用最新相关工作中出现的提示的模型样本。

BriefGPT - AI 论文速递 ·