SpMis:合成口语虚假信息检测的研究
原文中文,约300字,阅读约需1分钟。发表于: 。本研究针对合成语音技术迅速发展的背景下,合成口语虚假信息检测的迫切需求。通过引入开源数据集SpMis,本文提供了一种新方法,旨在分析说话者身份、主题和合成方式等因素对虚假信息检测的影响。研究结果显示出检测能力的潜力,但也揭示了实际应用中的重大挑战,强调了该领域进一步研究的重要性。
本文介绍了三种生成合成样本的方法,用于训练和评估多模态大语言模型,解决了多模态样本稀缺性问题,提高了系统性能,并促进了跨模态关系建模。实验结果表明,在理解文本和语音方面取得了进展,使用未标注的语音数据生成质量可与有转录的样本媲美的合成样本,使这些模型能够更多地应用于其他语言。