本研究提出Libra-Leaderboard框架,旨在通过平衡性能与安全性来评估大型语言模型(LLM)。该框架结合动态排行榜与互动竞技场,促进能力与安全的共同优化,强调模型在多个维度的平衡。
完成下面两步后,将自动完成登录并继续当前操作。