从有偏选择标签到伪标签:一种期望最大化学习框架应对有偏决策
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
研究者提出了一种基于两个EM循环的优化算法,用于解决深度学习算法中的标签噪声问题。实验证明该算法在各种类型的标签噪声下具有显著优势。
🎯
关键要点
-
深度学习算法中的劳动密集型标注成为瓶颈,处理不完美标签受到关注。
-
研究者将带有噪声标签的问题形式化为在嘈杂数据中找到结构化流行体的任务。
-
提出了一个合适的目标函数和基于两个EM循环的优化算法。
-
两个EM循环相关的分离网络合作优化目标函数,一个模型区分干净标签和损坏标签,另一个模型修复损坏标签。
-
最终得到一个非坍塌的学习带噪声标签的飞轮模型。
-
实验结果表明,该算法在各种类型的标签噪声下取得了最先进的性能,具有显著优势。
➡️