本文评估了大型语言模型在零样本、一次样本和少样本设置下执行多项选择符号绑定任务的能力。作者通过预测问题上下文中最可能的答案字符,评估了六个知名的大型语言模型在越南语MCSB任务上的结果。
该研究评估了大型语言模型在零样本、一次样本和少样本设置下执行多项选择符号绑定 (MCSB) 以解决多项选择问题回答 (MCQA) 任务的能力,并在越南语 MCSB 能力上展示了有希望的结果。研究提供了结构化的 LaTeX 公式指南,创建了一个新颖和高质量的数据集,用于评估大型语言模型和较小语言模型的 MCSB 能力。
完成下面两步后,将自动完成登录并继续当前操作。