BriefGPT - AI 论文速递 ·

Sign2GPT：利用大型语言模型进行无术语手语翻译

💡 原文中文，约1400字，阅读约需4分钟。

📝

内容提要

本文介绍了手语翻译（SLT）方法的研究进展，包括基于规则的转换、视觉-语言预训练模型和混合式SLT方法。这些方法在多个基准数据集上显著提高了翻译性能，尤其是在手语到文本的准确性和BLEU-4分数方面。

🎯

提出了一种简单高效的规则转换方法，显著提高了SLT性能，尤其在PHEONIX-WEATHER 2014T和ASLG-PC12数据集上取得了最新成果。
基于视觉-语言预训练的GFSLT-VLP方法结合了对比式语言-图像预训练和掩码自监督学习，BLEU-4分数提升超过5。
研究提出了两个基于规则的启发式方法，提高了手语到文本翻译的准确性，成功将美国手语翻译成英语和德国手语翻译成德语。
引入了一种基于Transformer的架构，通过CTC loss实现了连续手语识别和翻译的端到端训练，在PHOENIX14T数据集上取得了最先进的效果。
提出了一种基于迁移学习的手语翻译模型，显著优于之前的模型，为未来研究提供了有效基准。
讨论了自动手语处理的概念及其在机器翻译中的限制，提出了增强评估和改进数据集的建议。
实现了一个从文字到手语的系统，包含词形还原器、基于规则的单词重排和神经机器翻译系统。
引入混合式SLT方法Spotter+GPT，通过训练手语识别器和预训练语言模型提高SLT性能。
介绍了GloFE框架，解决无手语注释的翻译问题，在大型数据集上获得最新结果。
提出任务感知的指令网络TIN-SLT，通过引入指令模块和特征融合策略提高翻译性能，并在PHOENIX-2014-T和ASLG-PC12数据集上取得了BLEU-4的显著提升。

❓

手语翻译（SLT）是将手语转换为文本或口语的过程，旨在提高手语与书面或口头语言之间的沟通效率。

提高手语翻译性能的方法包括基于规则的转换、视觉-语言预训练模型和混合式SLT方法等。

GFSLT-VLP方法结合了对比式语言-图像预训练和掩码自监督学习，显著提升了BLEU-4分数。

从文字到手语的转换可以通过词形还原器、基于规则的单词重排和神经机器翻译系统来实现。

Spotter+GPT是一种混合式SLT方法，通过训练手语识别器和预训练语言模型来提高手语翻译性能。

TIN-SLT网络通过引入指令模块和特征融合策略，充分利用预训练模型的语言能力，提升了手语翻译性能。

🏷️