可解释的主动学习用于偏好调查
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文介绍了一种新的算法,批量主动偏好学习,使用少量数据样本进行奖励函数学习,查询生成时间短。通过实验,结果表明该算法仅需少量计算时间短的查询。算法在学习人类用户喜好的研究中有应用。
🎯
关键要点
- 介绍了一种新的算法,批量主动偏好学习。
- 该算法使用尽可能少的数据样本进行有效的奖励函数学习。
- 算法具有较短的查询生成时间。
- 为批量主动学习问题引入了几个近似,并提供了收敛的理论保证。
- 实验结果表明算法仅需少量计算时间短的查询。
- 算法在学习人类用户喜好的研究中有应用。
➡️