谷歌在Gemini 3 Flash中引入代理视觉,结合视觉推理与代码执行,通过“思考-行动-观察”循环分析图像并执行Python代码,提升视觉任务准确率5-10%。该方法细致检查图像细节,增强视觉推理能力,未来将扩展更多功能。
完成下面两步后,将自动完成登录并继续当前操作。