本文介绍了一种实时生成精准视差图的方法,能够根据计算资源自动调整,适用于资源受限设备。提出了多种深度估计算法,包括基于深度卷积神经网络的全向立体算法和多任务视觉感知网络,均在深度估计精度上优于传统方法。此外,研究了360度摄像机的深度估计和鲁棒性评估,提出了MSI-NeRF方法用于虚拟现实中的全景深度估计。
该文章介绍了一种商用设备上部署的低功耗边缘计算优化的实时因果神经网络活动说话人检测系统。该系统利用麦克风阵列和360度摄像机的数据进行活动说话人检测,并在计算预算耗尽时表现出优雅的降级。与传统的声源角估计方法不同,该系统利用检测到的头部位置学习查询可用的声学数据。作者在一个现实的会议数据集上训练和评估了该算法。
该文章介绍了一种商用设备上部署的低功耗边缘计算优化的实时因果神经网络活动说话人检测系统。该系统利用麦克风阵列和360度摄像机的数据进行活动说话人检测,并在计算预算耗尽时表现出优雅的降级。与传统的声源角估计方法不同,该系统利用检测到的头部位置学习查询可用的声学数据。该系统在现实的会议数据集上进行了训练和评估,包含具有挑战性的场景。
该系统是一个实时的说话人检测系统,利用麦克风阵列和360度摄像机的数据,通过虚拟电影摄影模块进行优化。该系统在计算预算耗尽时表现出优雅的降级,仍能正常运行。与传统的声源角估计方法不同,该系统利用检测到的头部位置学习查询可用的声学数据。该系统在一个现实的会议数据集上进行了训练和评估,包含达到14个与会者的同一会议、语音重叠和其他具有挑战性的场景。
完成下面两步后,将自动完成登录并继续当前操作。