小红花·文摘

该文章介绍了一个多模态视觉框架，用于精确畜牧业。该框架利用GroundingDINO、HQSAM和ViTPose模型，可以从视频数据中进行全面的行为分析，无需动物标记。该框架适用于各个物种和视频分辨率，为畜牧监测带来革命。