Multi-Agent Knowledge Visual Question Answering Based on Large Language Models
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种多智能体投票框架,旨在改善现有知识视觉问答方法的不足。通过设计三种基于大型语言模型的智能体,模拟团队协作,并利用投票机制提升回答的准确性和有效性。
🎯
关键要点
-
本研究提出了一种多智能体投票框架,旨在改善现有知识视觉问答方法的不足。
-
该框架设计了三种基于大型语言模型的智能体,模拟团队协作。
-
通过投票机制提升回答的准确性和有效性。
➡️