MultiCamCows2024:用于农场工作中基于人工智能的荷斯坦-弗里斯牛再识别的多视角图像数据集
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
我们开发了一种多模态视觉框架用于精准畜牧业,结合了GroundingDINO、HQSAM和ViTPose模型。该框架通过视频分析动物行为,无需侵入性标记。GroundingDINO生成包围框,HQSAM分割个体动物,ViTPose估计关键点。通过绵羊数据集展示,该框架可提供活动模式、互动动态和姿势评估的洞察,适用于不同物种和分辨率,促进非侵入性畜牧监测,优化动物福利和生产力。
🎯
关键要点
- 开发了一种多模态视觉框架用于精准畜牧业,结合了GroundingDINO、HQSAM和ViTPose模型。
- 框架通过视频分析动物行为,无需侵入性标记。
- GroundingDINO生成包围框,HQSAM分割个体动物,ViTPose估计关键点。
- 在绵羊数据集上展示了活动模式、互动动态和姿势评估的洞察。
- 框架适用于不同物种和分辨率,促进非侵入性畜牧监测。
- 优化动物福利和生产力,推动农场管理的动力。
➡️