本研究提出了一种插拔式性能估计方法,利用少量未标记样本解决大语言模型在不同任务和上下文中的性能差异问题。通过负对数似然和困惑度优化LLM服务的选择和使用。
完成下面两步后,将自动完成登录并继续当前操作。