小红花·文摘

本文提出了声学邻域嵌入的理论框架，解释了如何在固定维度的嵌入空间中表示可变宽度的音频或文本内容。通过量化词语间音素相似性，该框架为理解和应用这些嵌入提供了基础，实验结果表明其在音频和文本嵌入的最近邻搜索中具有高准确性，适用于多种问题。