过去十年中,3D生成技术迅速发展,最近的研究表明扩散过程与策略梯度方法兼容,并通过美学评分函数改进了2D扩散模型。研究者开发了一种新的方法DDPO3D,结合了策略梯度方法和美学评分,用于改进基于得分的3D渲染。该方法与基于得分蒸馏的方法兼容,并可以融入各种奖励函数。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: