小红花·文摘

本研究分析了多模态基础模型的内部表示，探讨了文本与语音的语义等效性。研究发现，跨模态表示逐渐融合，文本与语音的长度适配对减少差距至关重要，且推动低资源语言的发展具有潜力。