Open-LLM-Leaderboard:LLM 模型评估、基准和竞赛中由多项选择题到开放式问题的转换

📝

内容提要

通过完全开放式问题的方法,本研究解决了多项选择题中选择偏好和随机猜测的问题,并建立了新的语言模型评估基准。

🏷️

标签

➡️

继续阅读