本研究提出了一种自适应变换器架构(ADAT),旨在改善手语翻译系统在捕捉短期时序依赖性和训练效率方面的不足。ADAT通过门控机制增强特征提取,显著提高了手语到文本翻译的准确率,并减少了训练时间。
本研究提出了一种新方法,利用事件流辅助RGB摄像头捕捉手势数据,克服了手语翻译算法在光照和运动模糊下的局限性。通过收集15776个样本的数据集VECSL,提出了新的手语翻译框架M$^2$-SLT,并取得了先进的结果。
本研究通过大型语言模型(LLM)增强美国手语(ASL)与印度手语(ISL)之间的翻译,旨在填补两者用户的沟通鸿沟。开发的框架实现了实时、高效的手语翻译,显著提高了手语用户的可及性,消除了交流障碍。
Signformer是一种新型手语翻译架构,旨在解决现有方法在资源消耗和实用性方面的问题。该研究在边缘人工智能应用中表现出色,显著降低了参数需求,并在2024年排行榜中名列第二。
本文介绍了手语翻译和识别技术的进展,包括基于关键点的损失函数、手势视频生成、姿势提取和自我监督学习等方法。这些新技术在手语翻译的准确性和效率上优于传统方法,尤其在低资源手语语言中展现出潜力。
本文介绍了一种新型手语视频片段表示法,利用时空语义金字塔网络(TSPNet)进行手势识别和特征学习,优化手语翻译过程。研究展示了基于关键点的损失函数、混合动作基元架构和语言学先验等方法,显著提升了手语翻译性能,并通过自监督学习和大型语言模型提出了高效的手语表示学习方法,推动了手语翻译技术的发展。
本研究提出了一种基于Transformer的手语翻译系统,结合CTC损失实现端到端训练,在PHOENIX14T数据集上取得了先进的翻译效果。研究强调了手语翻译中的挑战,并建议采用人机互动设计和不同的手语注释方式,以提高翻译质量。
本研究提出了一种基于Transformer的手语翻译架构,结合CTC loss实现端到端训练,超越传统模型。通过多通道变压器和统一神经模型SLTUNET,解决了手语翻译中的数据不足和模态差异问题,在多个数据集上取得了竞争力的翻译性能,呼吁跨学科研究以推动手语翻译的发展。
本研究提出了多种手语翻译模型,如STMC-Transformer和SignLLM,显著提高了手语翻译的BLEU分数。研究表明,传统的gloss监督方法效果不佳,建议采用端到端训练或新型注释方式。通过引入大型语言模型和对比学习策略,推动了手语翻译的性能提升,解决了表示密度问题,促进了该领域的发展。
本文提出了多种手语识别和翻译的新方法,包括对比视觉-文本转换(CVT-SLR)、交叉检索、GASLT模型和无语言标注的手语翻译框架Sign2GPT。这些方法通过自监督学习和预训练技术,显著提升了手语翻译的性能和准确性,推动了该领域的发展。
本研究探讨了美国手语中手指拼写的自动识别,采用深度神经网络和新模型,达到了82.7%的字符识别准确率。通过引入新数据集和多任务训练方法,显著提升了识别性能,并提出了有效的手语翻译方案。
本文介绍了手语翻译方法的研究进展,包括GFSLT-VLP模型和SignCL策略,这些方法显著提升了手语到文本的翻译性能。研究通过对比学习和自然语言处理技术,解决了手语翻译中的表示密度问题,并在多个数据集上取得了最新成果。
该研究提出了多种方法以提升手语翻译的准确性,包括无语言标注的手语翻译框架Sign2GPT和GASLT模型,这些方法显著提高了ASL和DGS的翻译效果。同时,研究还探讨了自动手语处理面临的挑战及未来的改进建议。
该研究提出了多种手语翻译方法,包括基于规则的启发式方法和无手语互译模型,显著提高了手语到文本翻译的准确性。通过引入对比学习策略和大型语言模型,研究在多个数据集上取得了最新成果,提升了翻译性能,解决了手语翻译中的表示密度问题。
本文提出了一种多流关键点注意网络,用于手语翻译,利用多通道变压器架构和深度学习方法,提升了手语识别和翻译性能,减少了对高质量数据集的依赖,并探讨了多模态信息的应用,显著提高了翻译准确率和效率。
本文介绍了一种创新的手语翻译方法,利用矢量量化和转换器将口语文本转化为动作序列,显著提高了翻译性能。研究提出的新框架有效解决了视觉与文本之间的对齐问题,并在多个数据集上取得了优异的结果,推动了手语翻译技术的发展。
本文介绍了一系列创新方法用于手语自动翻译,包括利用矢量量化和转换器将口语文本转化为动作序列,开发高质量手语视频的方法,以及基于关键点的损失函数的SignGAN模型。这些方法在多个手语数据集上表现优于传统技术,显著提高了翻译的准确性和流畅性。
该研究提出了多种手语翻译和识别的新方法,如关键点规范化、随机帧选择和多模态特征融合,显著提高了翻译准确率和识别性能。研究通过先进模型和数据集展示了手语翻译和识别的有效性,推动了手语技术的发展。
本文介绍了手语翻译(SLT)方法的研究进展,包括基于规则的转换、视觉-语言预训练模型和混合式SLT方法。这些方法在多个基准数据集上显著提高了翻译性能,尤其是在手语到文本的准确性和BLEU-4分数方面。
该研究提出了多种手语翻译方法,包括基于规则的启发式方法和视觉-语言预训练模型,显著提高了手语到文本的翻译准确性。通过创新的矢量量化和任务感知网络,研究在多个基准数据集上取得了优异的BLEU得分,推动了手语翻译技术的发展。
完成下面两步后,将自动完成登录并继续当前操作。