本研究提出了一种利用单语语料库和生成对抗网络(GAN)相结合的新方法,以增强低资源语言翻译任务的训练数据并提高翻译质量。该方法通过回译、数据增强和无监督神经机器翻译等技术,有效提高了翻译性能。
本研究探讨了处理长篇法律文本的两种方法:改进的 Longformer 和 TF-IDF 表示。结果表明,改进的 Longformer 在 LexGLUE 中表现最佳,且计算效率更高。研究还提出了通过短输入和递归方法提高模型效率的策略,显著加速训练并减少内存使用。此外,探讨了 Transformer 模型在低资源语言翻译中的应用及超参数调整的重要性。
完成下面两步后,将自动完成登录并继续当前操作。