小红花·文摘

本研究提出Libra-Leaderboard框架，旨在通过平衡性能与安全性来评估大型语言模型（LLM）。该框架结合动态排行榜与互动竞技场，促进能力与安全的共同优化，强调模型在多个维度的平衡。