本论文提出了WebQA,引入了一个新的测量标准,涉及大规模最先进模型的困难之处,但对人类来说很简单。目标是创建统一的多模态推理模型,回答问题并查询丰富的视觉在线世界。
完成下面两步后,将自动完成登录并继续当前操作。