Google Messages推出了一项AI功能,实时监控短信以防止诈骗,默认开启,仅针对未保存的联系人。其他新功能包括在Find My应用中与“可信联系人”共享实时位置,以及Pixel设备的多摄像头流媒体支持。
Blackmagic Design发布了其Android 2.0版免费相机应用,新增多摄像头远程功能,支持多款三星Galaxy手机及部分Android平板。更新还包括Tilta USB镜头控制、用户界面改进和更高帧率视频捕捉等功能。
DuduCam是一款将多部智能手机转变为同步多摄像头工作室的应用,利用AI技术实现智能角度检测和自动编辑,支持实时预览和一键控制,适用于体育赛事、婚礼、音乐视频等场合,轻松制作专业级视频。
本研究提出了一种基于自监督学习的行动识别模型,旨在提高分心驾驶行为的检测准确性。通过多摄像头视角和条件后处理,精确定位分心行为及其时间边界,最终在2024 AI City Challenge中获得第六名。
本文提出了一种基于讲座语义的自动多摄像头导向和编辑系统,旨在改善远程教育中学生的学习体验。该系统能够实时引导视频流并进行离线编辑,提升在线教学的观看体验和信息质量。实验结果表明,该系统有效解决了视角限制带来的问题。
本研究提出了一种基于视觉变换器的实时防碰撞系统V-CAS,利用多摄像头数据分析和自适应刹车机制,实时评估碰撞风险,准确率超过98%,有效提升车辆安全性,具有广泛应用潜力。
本研究通过图形表示法解决在线多摄像头车辆追踪中的效率低和错误累积问题,实现时空聚类,提高追踪准确性。在CityFlow和Synthehicle数据集上,IDF1指标分别提升了14%和25%。
该论文提出了一种基于多摄像头的鸟瞰图像获取方法,利用神经网络进行环境感知,解决了单目摄像头的距离估计问题。研究展示了新框架BEVFormer和BEVerse在自动驾驶任务中的优越性,提升了3D物体检测和运动预测的准确性。此外,介绍了M-BEV框架和RoadBEV模型,显著提高了道路重建的准确性,具有实际应用潜力。
本文提出了一种自我监督的深度估计框架,结合多摄像头技术和新型网络FSNet,显著提升了自动驾驶中的深度预测准确性。研究表明,该方法在多个数据集上表现优于现有模型,尤其在尺度一致性和特征提取方面具有创新性。
本文提出了一种名为 DAP(预测后检测)的模型,通过两个分支网络增强多摄像头 3D 物体检测性能。一个分支负责预测物体位置,另一个分支进行物体检测,融合预测特征显著提升检测效果。实验结果表明,该模型在 nuScenes 数据集上表现出一致的性能提升。
本文介绍了一种创新的多摄像头车辆追踪系统,利用自监督的摄像头链接模型和时空约束,实现了在多移动相机环境下的多目标跟踪。该系统在CityFlow V2基准测试中取得了61.07%的IDF1得分,展示了其高效性和成本效益。此外,研究提供了一个大规模数据集MTMMC,包含多模态摄像机捕获的视频序列,为多摄像头跟踪研究提供了挑战性测试平台。
索尼更新了监控与控制(M&C)移动应用,新增多摄像头监控功能,支持iPadOS用户同时远程控制和预览最多四个摄像头。应用现支持更多索尼相机,提供全屏监控,解决了用户对画面裁剪的抱怨,并增加了自定义工具和更直观的控制选项。
本研究提出了多种行人检测方法,包括基于对比学习的示例字典、深度学习架构、跨模态学习和多摄像头组合检测,旨在提高检测精度和效率,尤其在低光和人群密集情况下表现优异。实验结果表明,所提方法在多个数据集上取得了先进性能。
介绍了一种名为SceneCalib的自我校准方法,适用于户外环境,能够确保多摄像头和激光雷达传感器之间的内外参一致,无需标定目标和人为干预。
完成下面两步后,将自动完成登录并继续当前操作。