EfficientViT-SAM:高效的无损性能 Segment Anything 模型
💡
原文中文,约500字,阅读约需2分钟。
📝
内容提要
EdgeSAM是一种适用于边缘设备的加速变体的Segment Anything Model(SAM),通过优化ViT-based SAM图像编码器为纯CNN-based架构,提高了速度。EdgeSAM通过引入盒状和点状提示来捕捉用户输入和掩码生成之间的复杂动态,相比原始SAM提速40倍,在边缘设备上比MobileSAM快14倍,同时在COCO和LVIS上提高了2.3和3.2的平均交并比(mIoUs)。EdgeSAM是第一个可以在iPhone 14上以超过30 FPS运行的SAM变体。
🎯
关键要点
- EdgeSAM 是 Segment Anything Model(SAM)的加速变体,优化用于边缘设备。
- 通过将 ViT-based SAM 图像编码器精炼为纯 CNN-based 架构,提高了速度。
- 引入盒状和点状提示,捕捉用户输入和掩码生成之间的复杂动态。
- EdgeSAM 相比原始 SAM 提速 40 倍,在边缘设备上比 MobileSAM 快 14 倍。
- 在 COCO 和 LVIS 数据集上,平均交并比(mIoUs)分别提高了 2.3 和 3.2。
- EdgeSAM 是第一个可以在 iPhone 14 上以超过 30 FPS 运行的 SAM 变体。
- 代码和模型可在指定的 URL 获取。
➡️