AdaBrowse: 自适应视频浏览器以提高连续手语识别效率
原文中文,约300字,阅读约需1分钟。发表于: 。提出了一种新的自适应模型(AdaBrowse),通过将连续手语识别(CSLR)问题建模成顺序决策任务,动态选择输入视频序列中最具信息量的子序列,并利用时空冗余实现高效计算,对四个大规模 CSLR 数据集进行了广泛的实验,证明了 AdaBrowse 的有效性。
本文介绍了改进的AdaFocusV3框架,通过在信息丰富的三维视频块上激活高性能网络以降低计算成本,并通过自适应轻量的策略网络根据测试时间需求动态配置视频块数量。实验结果表明,该模型比竞争算法更有效率。