小红花·文摘

通过实验发现，精细的反馈不一定总是优于粗略的反馈。确定了精细反馈获取和利用的关键挑战。在某些情况下，精细的反馈可能导致更差的模型；然而，在已知属性的受控环境中，精细的奖励确实可以更加有帮助，需要仔细考虑反馈属性并可能呼唤新的建模方法来合理地挖掘精细反馈的潜在价值。