清华大学和香港科技大学的研究提出了一种新的加速器设计,解决多模态Transformer模型在硬件执行时的稀疏性问题。通过优化调度器、令牌修剪器和自适应网络,提高了计算效率,减少了延迟。多模态模型在视觉问答和图像描述等领域有广泛应用,未来将进一步推动AI发展。
完成下面两步后,将自动完成登录并继续当前操作。