Open-LLM-Leaderboard:LLM 模型评估、基准和竞赛中由多项选择题到开放式问题的转换 发表于:2024-06-11T00:00:00Z。 通过完全开放式问题的方法,本研究解决了多项选择题中选择偏好和随机猜测的问题,并建立了新的语言模型评估基准。 llm