FabuLight-ASD:通过肢体语言揭示语音活动

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出FabuLight-ASD模型,通过整合面部、音频和身体姿态信息,显著提升了多模态环境中主动说话者检测的准确性和鲁棒性,mAP达到94.3%。

🎯

关键要点

  • 本研究提出FabuLight-ASD模型。
  • FabuLight-ASD模型整合了面部、音频和身体姿态信息。
  • 该模型显著提升了多模态环境中主动说话者检测的准确性和鲁棒性。
  • 在面对言语障碍、面部遮挡和背景噪音等挑战场景中,mAP达到94.3%。
  • 研究验证了身体姿态数据集成的有效性。
➡️

继续阅读