IDGen:用于大语言模型评估的项目区分诱导提示生成

📝

内容提要

本研究针对现有大语言模型(LLM)评估中缺乏足够区分能力的问题,提出了一种基于项目区分理论的提示合成框架。该框架能够生成多样且具体的提示,以有效评估LLM的能力,并揭示模型之间的性能差异,为评估数据合成研究提供了有价值的工具。

🏷️

标签

➡️

继续阅读