本研究探讨了大语言模型在处理代码混合输入时的不安全输出问题,揭示了导致有害行为的机制,并区分了普遍与文化特定的不安全查询,为理解这一现象提供了新见解。
本研究提出CultDiff基准,评估文本到图像扩散模型在生成文化特定图像方面的能力,发现模型在建筑、服装和食品等领域表现不足,强调需要更具包容性的生成AI系统。
完成下面两步后,将自动完成登录并继续当前操作。