该研究提出了一种新系统,利用音视频自我蒸馏技术,使唇读更加个性化和准确。系统通过专门的预训练适应不同说话者,结合视觉和音频数据,显著提升了传统唇读方法的准确性。
本研究提出GLaM-Sign,旨在改善聋人及听障人士的沟通,提升希腊旅游行业的包容性。该项目结合音频、视频、文本转录和手语翻译,未来将扩展至更多语言,展示多模态资源在沟通与创新中的潜力。
本研究提出了一种基于双向长短时记忆网络的多视角口型识别系统,显著提高了分类精度。实验表明,该系统在噪音环境下的唇语识别有效性,并引入新方法提升鲁棒性,为阿拉伯语口型识别提供了新机会。
完成下面两步后,将自动完成登录并继续当前操作。