EfficientViT-SAM:高效的无损性能 Segment Anything 模型
原文中文,约500字,阅读约需2分钟。发表于: 。我们提出了 EfficientViT-SAM,这是一种新的快速分段任意模型系列,通过保留 SAM 的轻量级提示编码器和屏蔽解码器,以 EfficientViT 替代了较重的图像编码器。通过从 SAM-ViT-H 图像编码器到 EfficientViT 的知识蒸馏进行训练,并在 SA-1B 数据集上进行端到端训练,EfficientViT-SAM 在不损失性能的情况下,在 A100 GPU...
EdgeSAM是一种适用于边缘设备的加速变体的Segment Anything Model(SAM),通过优化ViT-based SAM图像编码器为纯CNN-based架构,提高了速度。EdgeSAM通过引入盒状和点状提示来捕捉用户输入和掩码生成之间的复杂动态,相比原始SAM提速40倍,在边缘设备上比MobileSAM快14倍,同时在COCO和LVIS上提高了2.3和3.2的平均交并比(mIoUs)。EdgeSAM是第一个可以在iPhone 14上以超过30 FPS运行的SAM变体。