本研究提出了一种多智能体投票框架,旨在改善现有知识视觉问答方法的不足。通过设计三种基于大型语言模型的智能体,模拟团队协作,并利用投票机制提升回答的准确性和有效性。
本研究提出了一种基于投票的偏好优化框架(VPO),通过贝叶斯最小均方误差估计器改进生成结果,显著增强了对齐多样主观偏好的能力,实验结果表明其性能优于现有方法。
完成下面两步后,将自动完成登录并继续当前操作。