本研究提出混合变换器(MoT)模型,旨在解决大规模多模态模型训练中的计算资源和数据集规模问题。MoT通过解耦非嵌入参数,提高处理效率,显著降低预训练计算成本,同时保持与密集模型相当的性能,缩短训练时间,展现出实际应用潜力。
本研究提出PETAH方法,解决资源受限应用中混合变换器的任务适应性不足问题。该方法通过共享变换器骨干网络和剪枝技术,实现多任务模型的性能和存储优化,适用于移动硬件。
完成下面两步后,将自动完成登录并继续当前操作。