小红花·文摘

本研究提出TALE框架，以解决大语言模型在实际应用中对静态评估的成本和可扩展性问题。TALE通过主动检索外部证据，提高评估的可靠性，实验结果表明其优于传统评估指标。