应用隐私保护视频分析的可解释人工智能量化自闭症谱系障碍中的干扰和高风险行为在现实世界课堂环境中
原文中文,约400字,阅读约需1分钟。发表于: 。通过使用视频为基础的群体活动识别技术,我们展示了最新的进展,可以在教室环境中以实际活动来量化 ASD 中的行为,同时保护隐私。我们的可解释模型可以以 77% 的 F1 分数检测到问题行为的发生,并捕捉到 ASD 中不同类型行为的独特特征。据我们所知,这是第一项显示在真实环境中客观量化 ASD 行为的工作,这对于开发一个实用的工具以减轻教室工作人员的数据收集负担是一项重要的进展。
本文介绍了视听自闭症行为识别的新问题,通过收集音视频自闭症谱系数据集,实验证明整合音频、视觉和语音模态可以提高自闭症行为识别性能。同时探索了多模态大语言模型的潜力。