本文探讨了使用全卷积神经网络解决低信噪比下听力辅助设备中的背景噪音问题,提出了冗余卷积编码解码网络(R-CED),该网络体积小且性能优越,适用于嵌入式系统。研究表明,该方法在语音增强和识别任务中显著提高了效果,尤其在处理口吃症和耳语语音时表现出色。
本文介绍了多种文本识别和检测方法,包括基于Transformer的艺术文本识别、变形鲁棒的文本定位和全卷积神经网络的文本检测。这些方法在不同数据集上表现优异,显著提高了文本识别的准确性和鲁棒性。
完成下面两步后,将自动完成登录并继续当前操作。