小红花·文摘

本研究针对大型语言模型（LLMs）的安全风险，提出了CFSafety评估基准，涵盖10个安全问题，评估了八种流行的LLMs。尽管GPT-4表现优异，但安全性仍需改进，为未来模型的安全性提升提供参考。