评估多模态语言模型作为视觉辅助工具对视障用户的有效性

📝

内容提要

本研究探讨了多模态大型语言模型(MLLMs)作为视障个体的辅助技术的有效性,发现用户在使用中面临的主要挑战包括上下文理解、文化敏感性和复杂场景理解。通过系统评估十二个MLLMs,我们揭示出其在文化背景、多语言支持和盲文阅读理解等方面的局限性,为未来多模态人工智能的无障碍技术发展提供了重要见解。

🏷️

标签

➡️

继续阅读