基于大型视觉语言模型的视障人士环境感知系统

📝

内容提要

本研究解决了视障人士由于自然场景复杂性而导致的环境感知困难。文章提出了一种基于大型视觉语言模型的环境感知系统,通过可穿戴设备捕捉当前场景并提供分析结果,帮助视障人士更好地理解环境。实验结果表明,该系统能够比现有技术提供更准确的场景描述,显著改善视障人士的环境感知能力。

🏷️

标签

➡️

继续阅读