小红花·文摘

清华大学与南洋理工大学合作推出AudioTrust，建立了针对音频大语言模型（ALLMs）的六维可信度评估框架，涵盖公平性、幻觉、安全性、隐私、鲁棒性和身份验证。该框架通过真实场景数据和自动化评估，揭示了模型在高风险任务中的潜在风险与局限性，为音频模型的可信性研究奠定基础。

量子位 ·

本研究提出了Multi-AudioJail框架，针对音频大语言模型中的安全漏洞，特别是多语言和多口音的越狱问题。研究表明，这些攻击方式提高了越狱成功率，揭示了多模态大语言模型的脆弱性，呼吁学术界关注这一安全隐患。

BriefGPT - AI 论文速递 ·