生成流网络(GFlowNets)是一种通过操作离散对象的组合采样方法,与强化学习相结合。研究者将学习生成流网络的任务重新定义为熵正则化强化学习问题,并展示了其在概率建模任务上的实际效率。熵正则化强化学习方法可以与已建立的GFlowNet训练方法竞争,为整合强化学习原理到生成流网络领域开辟了道路。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: