本研究提出了一种神经启发的神经响应归一化(NeuRN)层,旨在提升深度学习模型在未知目标领域的图像分类性能。实验结果表明,NeuRN在跨域任务中表现出色,为未来模型的发展提供了支持。
本研究探讨了深度神经网络在视频理解中的应用,分析了视频的时空特征,并回顾了视频理解模型的发展趋势及结构设计,旨在推动该领域的进步。
本研究介绍了ConceptMath,一个用于评估语言模型数学推理能力的双语基准。通过按照数学概念层次组织问题,可以评估不同细粒度的数学推理能力。提出了微调策略以改进模型的弱点。希望ConceptMath能指导开发人员了解模型的数学能力并促进模型发展。
多模态大型语言模型在短视频理解方面有进展,但对长视频理解仍不足。研究人员推出了LVBench测试集,用于挑战多模态模型的长期记忆和理解能力。通过LVBench,研究人员希望推动更先进的模型发展,解决长视频理解的复杂性。
多模态大型语言模型在短视频理解方面有进展,但对长视频理解仍不足。研究人员推出了LVBench测试集,挑战多模态模型的记忆和理解能力,以推动更先进的模型发展,解决长视频理解的复杂性。
多模态大型语言模型在短视频理解方面进展显著,但在长视频理解任务上表现不佳。研究人员推出了专门用于长视频理解的基准测试集LVBench,旨在挑战模型的长期记忆和扩展理解能力。通过LVBench,研究人员希望推动更先进的模型的发展,以满足长视频理解的复杂性。
本研究介绍了ConceptMath,一个用于评估语言模型数学推理能力的双语基准。通过按照数学概念层次组织问题,可以评估不同细粒度的数学推理能力。提出了微调策略以改进模型的弱点。希望ConceptMath能指导开发人员了解模型的数学能力并促进模型的发展。
完成下面两步后,将自动完成登录并继续当前操作。