Q-Ground: 内容为图片质量评估与大型多模态模型的相关性
原文中文,约400字,阅读约需1分钟。发表于: 。该研究论文使用大规模多模态模型结合详细视觉质量分析,探索细粒度视觉质量定位的 Q-Ground 框架,提出了 QGround-100K 数据集,并使用基于多尺度特征学习的 LMM 方法进行图像质量评估和失真分割,旨在建立一个新的细粒度视觉质量分析基准。
研究人员创建了一个用于基础视觉聊天的数据集,并引入了Grounding-Bench基准来评估模型能力。实验结果显示该模型在基准测试中表现优秀,并在其他基准测试中也有竞争力。