研究表明,古典语言如文言文和拉丁语能够绕过主流大模型的安全机制,导致100%成功输出有害内容。这是由于训练数据不平衡和古典语言缺乏安全对齐。此现象提醒AI行业重视多语言安全,重建评估体系,提升跨语言安全能力。
完成下面两步后,将自动完成登录并继续当前操作。