本研究提出了一种多模态时空适配器(MSTA),旨在解决视频动作识别中的灾难性遗忘问题,提升文本与视觉表示的对齐度,减少学习参数,同时保持模型的泛化能力,展示了提高迁移学习效率的潜力。
本研究提出了一种通信高效的人机交互联邦学习框架(CEFHRI),通过预训练模型和时空适配器解决数据异构性和通信成本挑战。实验证明CEFHRI在通信成本上优于完全微调,为工业环境提供了安全高效的人机交互联邦学习方法。
完成下面两步后,将自动完成登录并继续当前操作。