可解释的主动学习用于偏好调查

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本文介绍了一种新的算法,批量主动偏好学习,使用少量数据样本进行奖励函数学习,查询生成时间短。通过实验,结果表明该算法仅需少量计算时间短的查询。算法在学习人类用户喜好的研究中有应用。

🎯

关键要点

  • 介绍了一种新的算法,批量主动偏好学习。
  • 该算法使用尽可能少的数据样本进行有效的奖励函数学习。
  • 算法具有较短的查询生成时间。
  • 为批量主动学习问题引入了几个近似,并提供了收敛的理论保证。
  • 实验结果表明算法仅需少量计算时间短的查询。
  • 算法在学习人类用户喜好的研究中有应用。
➡️

继续阅读