本研究提出了一种新的发音评估框架IntraVerbalPA,结合了细粒度的帧级和抽象的话语级非语言线索,以及传统的语音和音素表示。该框架引入了“音素时长的优劣度”指标,模拟时长分布,并获得了与现有研究成果相匹配或超越的性能。
完成下面两步后,将自动完成登录并继续当前操作。