本研究提出TALE框架,以解决大语言模型在实际应用中对静态评估的成本和可扩展性问题。TALE通过主动检索外部证据,提高评估的可靠性,实验结果表明其优于传统评估指标。
完成下面两步后,将自动完成登录并继续当前操作。