基于冯·诺依曼熵的镜头分割关键帧提取
原文中文,约400字,阅读约需1分钟。发表于: 。本研究针对视频关键帧提取中的镜头分割问题,提出了一种基于冯·诺依曼熵的全新算法。该方法通过计算视频序列中帧的相似度矩阵的冯·诺依曼熵,实现了高效的镜头分割,从而有效提取出能完整且准确表达原始视频内容的关键帧,减少了重复帧的数量。
本研究提出了FrameRS模型,包括FrameMAE和Frame Selector。FrameMAE利用MAE原理处理视频环境,Frame Selector基于CNN架构,利用FrameMAE编码器预测关键帧。模型能有效压缩视频片段,保留约30%的关键帧。性能方面,模型展示了高效和准确性,改进了传统关键帧提取算法。