我们开发了一种多模态视觉框架用于精准畜牧业,结合了GroundingDINO、HQSAM和ViTPose模型。该框架通过视频分析动物行为,无需侵入性标记。GroundingDINO生成包围框,HQSAM分割个体动物,ViTPose估计关键点。通过绵羊数据集展示,该框架可提供活动模式、互动动态和姿势评估的洞察,适用于不同物种和分辨率,促进非侵入性畜牧监测,优化动物福利和生产力。
该文章介绍了一个多模态视觉框架,用于精确畜牧业。该框架利用GroundingDINO、HQSAM和ViTPose模型,可以从视频数据中进行全面的行为分析,无需动物标记。该框架适用于各个物种和视频分辨率,为畜牧监测带来革命。
完成下面两步后,将自动完成登录并继续当前操作。