开源的视觉搜索助手(VSA)模型已发布,使用两张RTX3090即可复现。VSA结合视觉语言模型,实时更新知识,提升图像处理能力,超越Perplexity付费版,适用于多模态研究,在开放集问答中表现卓越。
完成下面两步后,将自动完成登录并继续当前操作。