本文通过为特定激活函数的科尔莫哥洛夫-阿诺德网络(KAN)建立泛化界限,解决了理论分析不足的问题。这些界限在保证性能的同时,适用于不同的回归损失函数,为科学任务中的模型设计提供理论支持。
本文研究了语言引导定位视频中相关片段的问题,并提出了跨模态注意力模块和新的回归损失函数来提高定位精度。在Charades-STA和ActivityNet Captions数据集上超越了最先进的方法。
完成下面两步后,将自动完成登录并继续当前操作。