iFormer是一种新型混合人工智能系统,结合卷积神经网络和变换器,专为移动设备优化。它以低计算成本实现了先进性能,采用创新的令牌混合和通道混合方法,效率超越现有模型。
该研究报告提出了一种多模态远程会议视频质量预测框架,通过分别计算视觉和音频质量,在修补、帧、片段和视听层面上实现准确预测。该框架在现有数据库和新TVQA数据库上表现出色,计算成本低,适合移动和嵌入式系统。
完成下面两步后,将自动完成登录并继续当前操作。