FabuLight-ASD:通过肢体语言揭示语音活动
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出FabuLight-ASD模型,通过整合面部、音频和身体姿态信息,显著提升了多模态环境中主动说话者检测的准确性和鲁棒性,mAP达到94.3%。
🎯
关键要点
- 本研究提出FabuLight-ASD模型。
- FabuLight-ASD模型整合了面部、音频和身体姿态信息。
- 该模型显著提升了多模态环境中主动说话者检测的准确性和鲁棒性。
- 在面对言语障碍、面部遮挡和背景噪音等挑战场景中,mAP达到94.3%。
- 研究验证了身体姿态数据集成的有效性。
🏷️
标签
➡️