超越人类主观性与错误:一种新的人工智能评分系统
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
研究者提出了一种适用于ASAG数据集的弱监督注解过程和基于评分理由的神经符号模型,该方法在双语、多领域、多问题的训练设置中相比现有技术提高了均方根误差,为ASAG和教育NLP领域的未来研究提供了有前景的方向。
🎯
关键要点
- 自动评分短问答题并解释评分决策是一个具有挑战性的目标。
- ASAG 数据集中存在的评分理由注解非常有限。
- 提出了一种适用于 ASAG 数据集的弱监督注解过程。
- 提出了一种基于评分理由的可解释 ASAG 的神经符号模型。
- 在双语、多领域、多问题的训练设置中,该方法提高了均方根误差(RMSE)0.24 至 0.3。
- 该方法为 ASAG 和教育 NLP 领域的未来研究提供了有前景的方向。
➡️