使用大型语言模型进行翻译假设集成的实证研究
原文中文,约600字,阅读约需2分钟。发表于: 。通过对多个大型语言模型 (LLMs) 进行假设集成的研究,对于基于 LLM 的机器翻译问题,我们探讨了如何提高生成文本的质量。我们尝试了多种假设集成技术,如 ChatGPT、LLaMA 和 Alpaca,并进行了综合研究,包括生成假设的方法(多个提示、温度采样和束搜索)以及生成最终翻译的策略(基于指令、基于质量的重新排序和最小贝叶斯风险解码)。我们的研究结果表明,MBR...
本文探讨了大语言模型在训练中解决的问题,即互联网文本的下一个词预测,并提出了目的论方法来预测大语言模型的成功或失败。作者通过对两个大语言模型进行评估,发现大语言模型的准确性受到执行任务的概率、目标输出的概率和提供的输入的概率的影响。在低概率情况下,大语言模型的准确性会受到影响,AI 从业者需要谨慎使用。作者认为,我们不应该把大语言模型评估为人类,而应该把它们看作一类独特的系统。