CAGE技术由韩国SelectStar公司研发,旨在解决AI安全测试中的文化偏见问题。它通过“语义模具”方法自动生成适应不同文化的红队测试数据,显著提升小语种地区的风险检测能力。CAGE已在多个企业项目中应用,计划于2026年开源,以推动AI全球化部署的安全合规验证。
本研究引入世界观基准,评估大型语言模型的文化包容性,发现多代理系统显著改善观点分布,减轻文化偏见。
本研究提出RusCode基准,旨在解决文本到图像生成模型对非英语文化的偏见。通过评估19个类别的俄罗斯视觉文化要素,提升生成质量并促进对不同文化的理解。
完成下面两步后,将自动完成登录并继续当前操作。