清华大学与南洋理工大学合作推出AudioTrust,建立了针对音频大语言模型(ALLMs)的六维可信度评估框架,涵盖公平性、幻觉、安全性、隐私、鲁棒性和身份验证。该框架通过真实场景数据和自动化评估,揭示了模型在高风险任务中的潜在风险与局限性,为音频模型的可信性研究奠定基础。
本研究提出了Multi-AudioJail框架,针对音频大语言模型中的安全漏洞,特别是多语言和多口音的越狱问题。研究表明,这些攻击方式提高了越狱成功率,揭示了多模态大语言模型的脆弱性,呼吁学术界关注这一安全隐患。
完成下面两步后,将自动完成登录并继续当前操作。