小红花·文摘

本研究提出TALE框架，以解决大语言模型在实际应用中对静态评估的成本和可扩展性问题。TALE通过主动检索外部证据，提高评估的可靠性，实验结果表明其优于传统评估指标。

BriefGPT - AI 论文速递 ·

本研究提出了CoAst方法，解决了联邦学习中评估参与者对模型性能贡献的挑战。该方法通过量化重要参数和基于多轮通信中的参数相似性进行评估，提高了贡献评估的可靠性。实验结果表明，CoAst在评估可靠性上与现有方法相当，并优于无验证方法。

BriefGPT - AI 论文速递 ·