小红花·文摘

本文介绍了一种原型工具，旨在帮助教育工作者简化数学多项选择题的生成。研究发现，尽管语言模型能够生成形式良好的问题提示，但干扰项未能涵盖学生常见错误。人工智能与人类合作有潜力提高题目生成的效率。此外，研究探讨了大型语言模型在数学推理中的局限性，并提出了改进模型性能的对抗性训练方法。

BriefGPT - AI 论文速递 ·

本研究探讨了利用大型语言模型自动生成数学多项选择题的干扰项及反馈信息。结果表明，基于上下文的模型在生成高质量误选项方面优于传统模型。研究创建了包含298道教育问题的题库和77K多语言误选项词汇池，为未来研究奠定基础。此外，提出了新的评价模型DISTO，验证其在干扰项评价中的有效性。

BriefGPT - AI 论文速递 ·