Q-Ground: 内容为图片质量评估与大型多模态模型的相关性

该研究论文使用大规模多模态模型结合详细视觉质量分析，探索细粒度视觉质量定位的 Q-Ground 框架，提出了 QGround-100K 数据集，并使用基于多尺度特征学习的 LMM 方法进行图像质量评估和失真分割，旨在建立一个新的细粒度视觉质量分析基准。

研究人员创建了一个用于基础视觉聊天的数据集，并引入了Grounding-Bench基准来评估模型能力。实验结果显示该模型在基准测试中表现优秀，并在其他基准测试中也有竞争力。

Grounding-Bench 基准测试多模态模型数据集视觉聊天