本研究提出了一种基于文本中心的多模态评估方法,旨在解决课堂话语评估的不足。通过注意力机制和多任务学习,评估自然话语、提问和解释的质量。结果表明,文本模态主导,音频特征提升了模型与人类评分的一致性,为自动评估课堂话语质量奠定了基础。
完成下面两步后,将自动完成登录并继续当前操作。