本研究构建了一个包含205,034个示例的中文安全基准,旨在提升大型语言模型在中文环境中识别不安全内容的能力,揭示其在安全性方面的脆弱性,并为改进提供指导。
完成下面两步后,将自动完成登录并继续当前操作。