小红花·文摘

本研究分析了视觉语言模型（VLMs）在处理ASCII艺术时的局限性，发现其在文本与视觉模式冲突时存在文本优先偏见，且随着语义复杂度的增加，视觉识别能力下降。这为未来模型的改进提供了参考。