该研究提出了一种新的评估框架,结合了当前评估模型和提示性大语言模型,实现了对对话的鲁棒性和多语言性评估能力,并在多个基准测试中取得了最先进的成果。
该研究提出了一种新的框架,结合评估模型和提示性大语言模型,实现对对话的鲁棒性和多语言性评估能力,并在多个基准测试中取得了最先进的成果。
完成下面两步后,将自动完成登录并继续当前操作。