小红花·文摘 - 小红花技术领袖俱乐部

本研究构建了一个包含205,034个示例的中文安全基准，旨在提升大型语言模型在中文环境中识别不安全内容的能力，揭示其在安全性方面的脆弱性，并为改进提供指导。

ChineseSafe：评估大型语言模型安全性的中文基准

BriefGPT - AI 论文速递 ·