本研究提出了MegaCOIN数据集,以提升视觉语言模型在色彩感知和空间上下文理解方面的能力。经过微调,模型在视觉评估任务中表现显著改善,超越了GPT-4o等闭源模型。
完成下面两步后,将自动完成登录并继续当前操作。