MoColl:基于代理的特定与通用模型协作用于图像描述

📝

内容提要

本研究解决了图像描述任务中的特定领域与通用知识整合的不足。提出的MoColl框架通过将复杂任务分解为一系列相互关联的问答子任务,实现了领域特定的视觉分析与通用知识的有效结合。实验结果显示,该框架在放射学报告生成上显著提高了报告质量。

➡️

继续阅读