本文回顾了最近的面向视觉的多模态大型语言模型的体系结构、对齐策略和训练技术,并分析了其在多个任务上的应用。同时,还比较了不同模型的性能和计算要求。这项调查为未来的多模态大型语言模型的发展奠定了基础。
完成下面两步后,将自动完成登录并继续当前操作。