本研究提出GFlowVLM框架,旨在提升视觉语言模型在多步骤推理中的解决方案多样性和泛化能力。通过生成流网络微调,该框架增强了复杂推理任务的解决方案生成能力。
完成下面两步后,将自动完成登录并继续当前操作。