这项研究提出了一种名为“我知道(IK)”幻觉的创新视觉概念,旨在解决“我不知道”的场景。研究者提出了VQAv2-IDK基准和视觉解幻指令生成方法,并介绍了IDK-Instructions视觉指令数据库。实验证明了当前方法在处理IK幻觉时存在困难,但该方法有效减少了这些幻觉,证明了其多功能性。
完成下面两步后,将自动完成登录并继续当前操作。