本研究提出了ActFusion统一扩散模型,旨在解决视频中动作的时间分割和长期预测问题,最终在标准基准上取得了优异表现。
该研究使用计算机视觉评估行动质量,通过神经网络从视频数据中提取符号并应用规则进行评估。研究发现该系统比纯粹的神经网络方法更具信息量。系统实现了动作识别和时间分割,并生成详细报告,提供客观评分和可视证据。研究人员将公开训练数据和代码以便于可重复性。
完成下面两步后,将自动完成登录并继续当前操作。