本文提出了交互估计的抽象框架,通过学习者查询的点与目标的类似性来估计目标。介绍了不相似维度的组合度量,提出了简单通用的算法,并解决了后悔和PAC泛化边界的求解问题。展示了框架涵盖了统计查询学习和结构化强化学习两个经典模型,并改进了分析。
完成下面两步后,将自动完成登录并继续当前操作。