AnimalFormer:基于行为的精准畜牧农场的多模态视觉框架
发表于: 。我们介绍了一个多模态视觉框架,用于精确畜牧业,利用 GroundingDINO、HQSAM 和 ViTPose 模型的力量。此集成套件可以从视频数据中进行全面的行为分析,无需侵入性动物标记。GroundingDINO 在家畜周围生成准确的包围框,而 HQSAM 在这些框内分割个体动物。ViTPose...
我们介绍了一个多模态视觉框架,用于精确畜牧业,利用 GroundingDINO、HQSAM 和 ViTPose 模型的力量。此集成套件可以从视频数据中进行全面的行为分析,无需侵入性动物标记。GroundingDINO 在家畜周围生成准确的包围框,而 HQSAM 在这些框内分割个体动物。ViTPose...