SureMap:单任务和多任务的同时均值估计
📝
内容提要
本研究针对稀缺评估数据及小型子人群下的模型性能评估问题,提出了一种名为SureMap的评估方法。该方法通过将问题转化为结构化的同时高斯均值估计,并结合外部数据,实现了对黑箱模型的高效、准确的单任务和多任务评估,并在多个领域的实验中显示出显著的精度提升。
🏷️
标签
➡️