本研究探讨了利用大型语言模型自动生成数学多项选择题的干扰项及反馈信息。结果表明,基于上下文的模型在生成高质量误选项方面优于传统模型。研究创建了包含298道教育问题的题库和77K多语言误选项词汇池,为未来研究奠定基础。此外,提出了新的评价模型DISTO,验证其在干扰项评价中的有效性。
本文介绍了ECT方法,通过从ChatGPT中学习评价模型并应用于强化学习和重新排序方法,以改善序列生成模型。实验结果表明,ECT在机器翻译、文本风格转换和摘要任务上取得了有效结果。
完成下面两步后,将自动完成登录并继续当前操作。