MinorBench: A Benchmark Test Designed for Children's Content Risk
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种新分类法和开源基准测试MinorBench,用于评估大型语言模型拒绝儿童不安全请求的能力。结果显示,不同模型在儿童安全合规性方面存在显著差异,为改进儿童安全机制提供了建议。
🎯
关键要点
- 本研究提出了一种新的分类法,针对儿童内容风险问题。
- 引入了开源基准测试MinorBench,用于评估大型语言模型拒绝儿童不安全请求的能力。
- 评估结果显示不同模型在儿童安全合规性方面存在显著差异。
- 研究为改进儿童安全机制提供了切实建议。
➡️