通过大型语言模型探索数学多项选择题的自动生成方式
💡
原文中文,约1500字,阅读约需4分钟。
📝
内容提要
本研究探讨了利用大型语言模型自动生成数学多项选择题的干扰项及反馈信息。结果表明,基于上下文的模型在生成高质量误选项方面优于传统模型。研究创建了包含298道教育问题的题库和77K多语言误选项词汇池,为未来研究奠定基础。此外,提出了新的评价模型DISTO,验证其在干扰项评价中的有效性。
🎯
关键要点
- 本研究探索了如何利用大型语言模型自动生成数学多项选择题的干扰项和反馈信息。
- 上下文感知模型在生成高质量误选项方面优于传统特征模型,平均每10个选项中有3个被评为高质量误选项。
- 研究创建了298道教育问题的题库和77K多语言误选项词汇池,为未来研究奠定基础。
- 提出了新的评价模型DISTO,验证其在干扰项评价中的有效性,显示其更符合人体感知。
- 研究发现教师评价中53%的生成干扰项被评为高质量,优于现有模型。
❓
延伸问答
大型语言模型如何帮助生成数学多项选择题的干扰项?
大型语言模型通过结合上下文特征,自动生成高质量的干扰项,显著优于传统模型。
研究中创建了多少道教育问题的题库?
研究创建了包含298道教育问题的题库。
DISTO模型在干扰项评价中有什么优势?
DISTO模型更符合人体感知,相比于传统的机器翻译指标,验证了其在干扰项评价中的有效性。
上下文感知模型的表现如何?
上下文感知模型在生成高质量误选项方面表现优异,平均每10个选项中有3个被评为高质量。
教师对生成的干扰项的评价如何?
教师评价中53%的生成干扰项被评为高质量,优于现有模型。
研究为未来的研究奠定了哪些基础?
研究创建了298道教育问题的题库和77K多语言误选项词汇池,为未来研究提供了资源。
➡️