小红花·文摘

扩散模型奖励微调新突破：Nabla-GFlowNet让多样性与效率兼得

机器之心 ·

本研究提出GFlowVLM框架，旨在提升视觉语言模型在多步骤推理中的解决方案多样性和泛化能力。通过生成流网络微调，该框架增强了复杂推理任务的解决方案生成能力。

GFlowVLM: Enhancing Multi-Step Reasoning in Vision-Language Models through Generative Flow Networks

BriefGPT - AI 论文速递 ·

该文探讨了生成流网络（GFlowNets）的学习策略，提出了优先回放和贝叶斯技术等更有效的学习目标和方法，以提高样本效率和网络收敛性。研究表明，GFlowNets在处理稀疏奖励问题和生成高回报样本方面表现优越，为未来研究提供了新思路。

MetaGFN：利用自适应元动力学探索连续GFlowNet中的远程模式

BriefGPT - AI 论文速递 ·

本文介绍了一种基于生成流网络（GFlowNets）的生成策略，旨在提高样本效率和多样性。通过优先回放和新目标平衡等方法，解决了训练中的稀疏奖励问题。研究表明，GFlowNets与强化学习结合能有效提升生成性能，并在多个基准测试中表现优异。

基于生成流网络的多智能体连续控制

BriefGPT - AI 论文速递 ·

生成流网络（GFlowNets）是一种学习离散空间概率质量函数的生成框架，具有出色的样本效率和目标分布匹配能力，尤其在处理长轨迹和稀疏奖励时表现优异。通过引入优先回放和新损失函数，GFlowNets在多个结构化对象生成任务中取得成功，并在强化学习中超越传统算法。

生成流网络（GFlowNets）在结构化对象生成和蛋白质设计中表现出色。提出了预期流网络和对抗性流网络，后者在Connect 4比赛中超越了AlphaZero。新算法Quantile Matching和基于能量的生成流网络（EB-GFN）提高了数据效率。Bifurcated GFlowNets（BN）通过分岔结构优化学习效率。进化引导生成流网络（EGFN）有效处理长轨迹和稀疏奖励。Order-Preserving GFlowNets（OP-GFNs）在多目标优化中表现优异。