普及问卷:利用基于 GPT 的翻译质量评估简化跨文化问卷调适
原文中文,约400字,阅读约需1分钟。发表于: 。通过结合 DeepL 的前向 - 后向翻译和 GPT-4 生成的翻译质量评估和改进建议,我们提出了一种原型工具,能够加快问卷翻译过程,评估结果表明,将 LLM 生成的翻译质量评估和改进建议整合起来可以帮助用户独立获得与传统非 NLP 支持的翻译方法相似的结果,这是朝着更加公平的基于人工智能的问卷调查研究迈出的第一步。
本研究评估了GPT-4在多语言对和领域中与人类翻译员的表现,发现GPT-4在总体错误数量上与初级翻译员相当,但低于中级和高级翻译员。此外,GPT-4在不同语言和领域中的翻译能力不平衡,存在逐字翻译问题。人类翻译员有时过于思考背景信息。这是首次对LLMs与人类翻译员进行评估,为了解LLM翻译的状态和限制提供了有价值的见解。