小红花·文摘

本文介绍了一种自监督预测学习（SSPL）方法，通过正样本挖掘实现声音定位，并结合声音与视频帧的增强视图。实验结果表明，SSPL在声音定位基准测试中表现优异，显著提升了性能。此外，研究还提出了多种无监督和半监督学习算法，以提高声源定位的准确性和可靠性。