通过最优传输对一个模型在未知领域的测试性能进行评估
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
该文章提出了一种基于最优输运的测度,利用仅在测试时可用的信息来估计机器学习模型在未知领域的性能。经过经验评估,证明了该测度在选择源数据和架构以获得最佳未知领域数据性能以及在测试时预测已部署模型在未知领域的性能方面的效用。与流行的预测熵测度相比,该测度在相关性方面表现更好。
🎯
关键要点
- 提出了一种基于最优输运的测度,利用测试时可用的信息来估计机器学习模型在未知领域的性能。
- 该测度在选择源数据和架构以获得最佳未知领域数据性能方面表现出效用。
- 通过经验评估,证明该测度在预测已部署模型在未知领域的性能方面有效。
- 与流行的预测熵测度相比,该测度在相关性方面表现更好,综合使用源领域和未知领域的信息。
➡️