基于为专业翻译设计的错误分类法测试大型语言模型在翻译注释中的能力:ChatGPT的首次实验

📝

内容提要

本研究探讨了大型语言模型(LLMs),特别是ChatGPT在基于错误分类法注释机器翻译输出的能力,弥补了以往主要关注一般语言的研究空白。通过测试不同的提示语和定制的错误分类法,我们发现ChatGPT在处理DeepL翻译结果时,其注释的召回率和准确率均较高,但在对自身翻译进行评估时表现较差,揭示了自我评估的局限性。研究结果强调了LLMs在专业领域翻译评价中的潜力与局限,为未来的自动化翻译评估研究奠定了基础。

🏷️

标签

➡️

继续阅读