LLM 对复杂的 FST 生成的芬兰语词汇的形态分析
原文中文,约300字,阅读约需1分钟。发表于: 。本研究旨在评估最先进的 LLM 模型在复杂芬兰名词形态分析任务中的表现,发现 GPT-4-turbo 在任务中存在困难,而 GPT-3.5-turbo、Llama2-70B 和 Poro-34B 模型几乎完全失败。
该研究提出了一种用于模拟复杂形态的框架解决方案,通过双层Transformer架构编码形态学信息,并使用多标签多任务训练和基于beam search的解码器提高机器翻译性能。在低资源环境中通过评估多种数据增强技术,提高了翻译性能。在基纳卢旺达语-英语翻译任务中表现有竞争力。