本研究评估了问题质量,定义了优质问题,并提出了一个评估框架,验证了其适用性和有效性。
本研究提出了STRIVE方法,利用大型语言模型自动生成评价,以优化问题质量评估,增强与人类判断的相关性,支持教育实践。
本研究提出了一种系统化的自动化评估方法,评估大语言模型生成问题的质量,关注问题的长度、类型、上下文覆盖和可回答性,为相关研究提供新视角。
完成下面两步后,将自动完成登录并继续当前操作。