Y-MAP-Net:实时深度、法线、分割、多标签说明和2D人体姿态识别
发表于: 。本研究解决了RGB图像多任务学习过程中实时性能和效率的挑战。通过采用多教师-单学生的训练范式,Y-MAP-Net能够在单次网络评估中同时预测深度、表面法线、人体姿态、语义分割并生成多标签说明。研究表明,该网络在保持强泛化能力的同时,具备简单性和计算效率,适合于机器人及其他实际应用。
本研究解决了RGB图像多任务学习过程中实时性能和效率的挑战。通过采用多教师-单学生的训练范式,Y-MAP-Net能够在单次网络评估中同时预测深度、表面法线、人体姿态、语义分割并生成多标签说明。研究表明,该网络在保持强泛化能力的同时,具备简单性和计算效率,适合于机器人及其他实际应用。