本研究提出AIDE框架,解决视觉语言模型(VLM)对更大模型的依赖问题。AIDE通过利用专业领域的专家模型自主增强能力,显著提升性能,无需更大模型或人工监督。
完成下面两步后,将自动完成登录并继续当前操作。