本研究针对大型语言模型(LLMs)的安全风险,提出了CFSafety评估基准,涵盖10个安全问题,评估了八种流行的LLMs。尽管GPT-4表现优异,但安全性仍需改进,为未来模型的安全性提升提供参考。
完成下面两步后,将自动完成登录并继续当前操作。