实时的主动说话者检测系统集成了音频 - 视觉信号和空间查询机制

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

该文介绍了一种低功耗边缘计算优化的实时因果神经网络活动说话人检测系统,能够在具有挑战性的场景下正常运行。作者在一个现实的会议数据集上训练和评估了该算法。

➡️

继续阅读