小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文提出了一种基于比较oracle的新偏好对齐方法,旨在解决现有方法在语言模型与人类偏好对齐中的冗长性和可能性偏移问题。实验结果表明,该方法在利用噪声偏好提升语言模型性能方面具有有效性和灵活性。

ComPO: Preference Alignment via Comparison Oracles

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-08T00:00:00Z

本研究分析了现有偏好对齐方法在大型语言模型中的局限性,尤其是对高质量正偏好数据集的依赖。提出了“遗忘以对齐”框架,通过双层优化量化负例遗忘对偏好对齐性能的影响,并通过实验验证了其有效性。

Bridging the Gap Between Preference Alignment and Machine Forgetting

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-09T00:00:00Z

本研究提出了一种新的后训练偏好对齐方法,旨在缩小多智能体运动生成模型与人类偏好之间的差距。通过利用先前训练示范中的隐式反馈,显著提高了生成行为的真实性和一致性,无需额外的人类偏好注释。

通过先验示范中的隐式反馈实现多智能体运动生成模型的直接后训练偏好对齐

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-25T00:00:00Z

本研究提出偏好对齐蒸馏(PAD)框架,旨在解决小型语言模型(SLMs)从大型语言模型(LLMs)中提取偏好知识的细化问题,显著提升人类偏好的对齐效果。

Capturing Fine-Grained Preferences: Preference Alignment Distillation for Small Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-20T00:00:00Z

本研究提出了一种即时偏好对齐方法,有效解决大型语言模型生成与人类价值观对齐的效率问题。实验结果表明,该方法在对齐任务中表现优异,具备高效性和有效性。

Instant Preference Alignment Based on Principle-Guided Decoding

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-20T00:00:00Z

本研究提出PIPA框架,以统一理解语言模型的偏好对齐问题。通过最大似然估计,PIPA实现了3-10%的性能提升,并有效整合了先验信息。

优先对齐的先验信息统计估计研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-09T00:00:00Z
细粒度对齐无需仔细标注了!淘天提出视觉锚定奖励,自我校准实现多模态对齐

AIxiv专栏促进学术交流,报道超过2000篇文章。淘天集团未来生活实验室专注于大模型和多模态AI技术,提出令牌级偏好对齐方法(TPO),有效缓解视觉大模型的幻觉现象,提升模型与视觉信息的关联性。

细粒度对齐无需仔细标注了!淘天提出视觉锚定奖励,自我校准实现多模态对齐

机器之心
机器之心 · 2025-01-19T04:07:07Z

本文探讨了视觉-语言-动作(VLA)模型在机器人操作中的应用与挑战,提出了GRAPE方法,通过偏好对齐提升机器人策略的泛化能力。GRAPE利用视觉语言模型分解任务,优化轨迹以适应不同操控目标,旨在降低强化学习成本并提高灵活性。

GRAPE——RLAIF微调VLA模型:通过偏好对齐提升机器人策略的泛化能力

结构之法 算法之道
结构之法 算法之道 · 2024-12-30T16:02:11Z

本研究提出了一种新颖的多视角偏好对齐方法(PA-RAG),有效解决了现有检索增强生成模型在信息量、鲁棒性和引用质量方面的不足,显著提升了生成器的性能。

PA-RAG: Achieving RAG Alignment through Multi-Perspective Preference Optimization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-19T00:00:00Z

本研究提出RAG-RewardBench基准,旨在解决检索增强语言模型与人类偏好对齐不足的问题。通过评估45个奖励模型,揭示了现有模型在偏好一致性方面的局限性,强调了进行偏好对齐训练的必要性。

RAG-RewardBench: Evaluating Reward Models in Retrieval-Augmented Generation for Preference Consistency

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z

本研究提出了一种新颖的偏好对齐框架RADIO,旨在解决检索增强生成(RAG)中重新排序器与生成器之间的相关性差距。通过大语言模型提取推理依据,优化文档排序和生成,实验结果表明该方法在多个任务上优于基线,具有显著实用价值。

Bridging the Gap Between Relevance and Reasoning: Rationale Distillation in Retrieval-Augmented Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-11T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码