本研究提出了一种基于去噪扩散概率模型的视频摘要生成框架,旨在解决注释不一致性问题。该方法通过概率分布生成摘要,减少主观噪声干扰,展现出良好的过拟合和泛化能力,实验结果验证了其有效性。
完成下面两步后,将自动完成登录并继续当前操作。