TwelveLabs于2025年12月1日发布了Marengo 3.0视频基础模型,具备视频理解、物体追踪和时空推理功能,存储成本降低50%,索引速度提升2倍。该模型支持多模态查询,适用于体育、媒体和公共安全等领域,现可通过Amazon Bedrock访问。
ViSpeak推出的实时视觉反馈系统通过结合视觉指令与语言模型,提升视频理解准确率2.67%。该系统有效处理动态视频内容,显著改善物体追踪和视频导航等应用的性能。
本研究比较了激光雷达与立体相机在室内环境中对单一物体的追踪性能,提出了一种快速物体检测器。结果表明,立体相机的追踪性能与激光雷达相当,但成本差异超过十倍。
完成下面两步后,将自动完成登录并继续当前操作。