CogniVoice: 多模态和多语言融合网络用于自发语音中的轻度认知损害评估
原文中文,约300字,阅读约需1分钟。发表于: 。CogniVoice 是一种多语言、多模态的框架,通过分析语音数据及其文本转录,检测轻度认知障碍(MCI)和估计最小精神状态检查(MMSE)得分。在 TAUKADIAL 挑战中,CogniVoice 在 MCI 分类和 MMSE 回归任务中凭借其集成的多模态和多语言网络,在 F1 和 RMSE 上分别比基线模型提高了 2.8 和 4.1 分,并且能够有效降低不同语言组间的性能差距 0.7 分。
该文章介绍了一种通过分析连接语言来评估认知功能的方法,提出了一个新的基准数据集和预测任务。数据集包含普通话和英语演讲者的言语样本和临床信息。通过倾向评分分析匹配数据,确保模型训练的平衡和代表性。预测任务包括轻度认知损害的诊断和认知测试分数的预测。提供基准预测模型来说明这一框架。在诊断中,平均未加权回忆率为59.2%,评分预测的均方根误差为2.89。