食品 SAM:任何食品分割
原文中文,约300字,阅读约需1分钟。发表于: 。FoodSAM 是一种创新的框架,整合了粗糙的语义掩膜和 SAM 生成的掩膜,以提高语义分割质量,并将零样本能力扩展到实例分割和全景分割,是首个在食品图像上实现实例、全景和可提示分割的工作。
本文介绍了一个名为Segment Anything Model(SAM)的基础模型,用于视觉任务的开发。SAM可以根据廉价的输入提示在图像中进行对象分割。作者通过大量的视觉基准任务研究了SAM的零样本图像分割准确性,并发现SAM通常能够实现与目标任务上训练的视觉模型类似甚至超过其识别精度。他们还检查了SAM在多样化、广泛研究的基准任务集上的表现。然而,作者还研究了SAM在航空图像问题中的表现,发现由于航空图像和目标对象的独特特征,SAM在某些情况下会失败。