MultiCamCows2024:用于农场工作中基于人工智能的荷斯坦-弗里斯牛再识别的多视角图像数据集

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

我们开发了一种多模态视觉框架用于精准畜牧业,结合了GroundingDINO、HQSAM和ViTPose模型。该框架通过视频分析动物行为,无需侵入性标记。GroundingDINO生成包围框,HQSAM分割个体动物,ViTPose估计关键点。通过绵羊数据集展示,该框架可提供活动模式、互动动态和姿势评估的洞察,适用于不同物种和分辨率,促进非侵入性畜牧监测,优化动物福利和生产力。

🎯

关键要点

  • 开发了一种多模态视觉框架用于精准畜牧业,结合了GroundingDINO、HQSAM和ViTPose模型。
  • 框架通过视频分析动物行为,无需侵入性标记。
  • GroundingDINO生成包围框,HQSAM分割个体动物,ViTPose估计关键点。
  • 在绵羊数据集上展示了活动模式、互动动态和姿势评估的洞察。
  • 框架适用于不同物种和分辨率,促进非侵入性畜牧监测。
  • 优化动物福利和生产力,推动农场管理的动力。
➡️

继续阅读