我们开发了一种多模态视觉框架用于精准畜牧业,结合了GroundingDINO、HQSAM和ViTPose模型。该框架通过视频分析动物行为,无需侵入性标记。GroundingDINO生成包围框,HQSAM分割个体动物,ViTPose估计关键点。通过绵羊数据集展示,该框架可提供活动模式、互动动态和姿势评估的洞察,适用于不同物种和分辨率,促进非侵入性畜牧监测,优化动物福利和生产力。
本研究回顾了户外畜牧监测中的计算机视觉方法,提出通过深度学习提高动物检测、计数和分类效率,以支持精准畜牧业的实时监测。
完成下面两步后,将自动完成登录并继续当前操作。