本研究提出了一种名为SSLR的半监督学习方法,旨在解决手语识别系统中标注数据稀缺的问题。通过为未标注样本生成伪标签,SSLR在使用较少标注数据的情况下,性能超过全监督学习模型,显示出在手语识别领域的潜力。
本文提出了BdSLW401,一个包含401个手势和102,176个视频样本的孟加拉手语数据集,以解决手语识别中的说话者变异和视角变化问题。通过引入相对量化编码(RQE),显著提升了基于变换器的手语识别效果,增强了模型的解释性和识别率。
本研究通过集成学习和多维视频Swin Transformer模型,解决了传统孤立手语识别中视角单一的问题,提升了模型在不同视角下的鲁棒性和泛化能力,并在相关比赛中获得第三名。
本文介绍了多个手语数据集及其相关研究,包括美国手语和英国手语的数据集,提出了基于姿态的手语识别模型和方法,探讨了手语处理的自动化技术及其在手语识别中的应用,旨在推动手语技术的发展和研究。
本研究提出了一种基于深度学习的手语识别系统,旨在解决听障人士沟通中的手语熟悉度不足问题。该系统采用LSTM模型和MediaPipe Holistic技术,能够实时识别手语动作,并在印地语手语数据集上实现了88.23%的识别准确率,具有广泛的应用前景。
本研究结合深度学习、迁移学习和变压器模型,提高了阿拉伯字母手语识别的准确性,在两个数据集上实现了99.6%的识别精度,为阿拉伯语听障人士提供了更好的沟通方式。
本文构建了一个包含5,988个日常生活场景的视频片段的中文连续手语数据集(CE-CSL),旨在解决现有数据集缺乏多样性的问题。同时,提出了一种新的时间-频率网络(TFNet)模型,显著提升了复杂背景下的手语识别性能。
本文介绍了美国手语单词语义数据集(WLASL)及其在手语识别中的应用,提出了一种基于姿态的时态图卷积网络(Pose-TGCN)方法,以提高手语识别的准确性和效率。同时,研究回顾了深度学习在手语制作中的进展与挑战,并探讨了未来的研究方向。
本文介绍了OpenHands库在手语识别中的应用,重点包括姿势提取、孤立手语模型训练和自我监督预训练。研究强调跨学科合作和手语使用者参与的重要性,并探讨非语言线索在自然语言处理中的作用。提出了改进手语生成和翻译的方法,包括使用深度学习模型和新评估标准SignBLEU,以提升手语翻译的质量和准确性。
本文介绍了多个手语数据集及其相关研究,包括美国手语、土耳其手语和孟加拉手语。研究者们开发了基于深度学习的手语识别模型,提高了识别准确率,并提供了新的数据集以促进手语技术的发展。这些研究为手语识别领域提供了重要的基准和方法。
本文研究了美国手语中指拼字母的识别,提出了一种基于深度神经网络的半马尔可夫条件随机场模型,取得了较高的字母识别准确率。同时,探讨了知识蒸馏在不同任务中的应用,提升了人脸识别、目标检测和动作识别的性能,尤其在数据稀缺情况下表现突出。
该研究探讨了手语识别和翻译的进展,提出了自动化数据提取和新数据集构建的方法,推动了手语识别模型的性能提升。研究分析了手语处理任务的挑战,介绍了多种手语翻译模型及其应用,强调了促进听障人士交流的重要性。
本文提出了多种手语识别和翻译的新方法,包括对比视觉-文本转换(CVT-SLR)、交叉检索、GASLT模型和无语言标注的手语翻译框架Sign2GPT。这些方法通过自监督学习和预训练技术,显著提升了手语翻译的性能和准确性,推动了该领域的发展。
本文介绍了美国手语单词语义数据集及其相关研究,提出了一种基于姿态的时态图卷积网络(Pose-TGCN)方法,以提高手语识别的准确性和效率。研究探讨了深度学习在手语识别中的应用,比较了不同技术的效果,并开发了实时手语识别系统,以帮助聋人群体。
该研究提出了一种新型骨骼感知多模态框架,以提高手语识别的准确率。实验结果表明,该框架在多个数据集上表现优异,尤其在手语识别挑战赛中取得了突出成绩。
本文研究通过SPOT-ALIGN框架改善印式手语的检索与识别,利用How2Sign数据集和交叉模态嵌入技术解决标注数据不足的问题,并提出新方法和模型以提高手语识别的准确性和效率。
本文介绍了多种基于CLIP的视觉语言模型创新方法,如AdaptSign、CLIP2Video、RankCLIP和SpeechCLIP。这些方法在手语识别、视频文本检索和对比学习等任务中表现优异,显著提升了模型的性能和准确性,尤其在零样本学习和多模态数据处理方面取得了重要进展。
本文探讨了手语识别技术的最新进展,重点介绍了连续手语识别(CSLR)和孤立手语识别(ISLR)方法。研究表明,关键点规范化、图卷积网络和多模态特征融合等技术显著提高了识别准确率,并在多个数据集上验证了其有效性。这些成果对低资源手语语言的研究具有重要意义。
本文介绍了一种基于混合CTC/注意力模型的ResNet-18和Conformer,显著提升了语音识别的准确性。通过引入AdaptSign和CSLR2模型,在连续手语识别和手语检索中取得了优异表现,并利用多语种手语数据集提升识别能力。此外,Conformer模型在LibriSpeech基准测试中超越传统模型,展示了在语音识别和分离任务中的潜力。
该研究利用多语种手语语料库和多模态数据,提出了多种新框架以提高连续手语识别的准确性和性能。实验结果表明,这些方法在多个数据集上取得了领先成果,推动了手语识别和翻译技术的发展。
完成下面两步后,将自动完成登录并继续当前操作。