小红花·文摘 - 小红花技术领袖俱乐部

本研究提出了一种插拔式性能估计方法，利用少量未标记样本解决大语言模型在不同任务和上下文中的性能差异问题。通过负对数似然和困惑度优化LLM服务的选择和使用。

Plug-and-Play Performance Estimation for LLM Services Without Reliance on Labeled Data

BriefGPT - AI 论文速递 ·