小红花·文摘

FlexAttention是一种增强大型视觉语言模型的方法，能够处理高分辨率图像并提高性能和效率。它通过动态选择重要区域和分层自注意机制来实现，并在多个基准测试中表现更好，减少了40%的计算成本。