本文介绍了风险距离的概念,用于量化监督学习问题中的采样偏差、噪声、有限数据和近似等问题的严重性。通过建立距离,探索了监督学习问题空间的几何特征,并提供了两个 Risk 距离的变种。
研究将战略性机器人行为学习转化为监督学习问题,通过四足机器人的实验发现监督信号质量与逃避者行为多样性、最优性和建模假设强度相关。机器人在追逐-逃避互动中表现出创造力,努力收集信息并预测意图以提前拦截。
本文介绍了使用Learning from Crowds框架中的Label Selection Layer方法解决Crowd annotations中的标签噪声问题。实验证明该方法在几乎所有监督学习问题中都能获得与当前最先进的方法相当的性能。
完成下面两步后,将自动完成登录并继续当前操作。