本研究分析了视觉语言模型(VLMs)在处理ASCII艺术时的局限性,发现其在文本与视觉模式冲突时存在文本优先偏见,且随着语义复杂度的增加,视觉识别能力下降。这为未来模型的改进提供了参考。
完成下面两步后,将自动完成登录并继续当前操作。