本研究探讨了Whisper ASR模型在自动语音识别中的幻觉问题,分析了不同声音诱导的幻觉,并提出了幻觉袋后处理方法,有效降低了字错误率。
该文章讨论了概率电路在可计算的概率生成建模领域中的应用,提出了构建具有表现力和高效性的概率电路的设计原则和算法扩展,并讨论了融合深度神经模型构建深层和混合概率电路的努力。同时,指出了未来研究的挑战和开放问题。
DeepISP是一个端到端的深度神经模型,用于照相机图像信号处理,包括去马赛克、降噪和色彩校正等任务。它在PSNR客观评估和主观人类评估方面表现出最先进的性能,具有更好的视觉质量。
本文研究了深度神经模型在图像质量评估方面的进展,并介绍了一个新的数据集用于比较IQA和Saliency Prediction任务之间的关系。
本文总结了深度学习在抽象视觉推理领域的应用研究进展,重点关注了瑞文渐进矩阵(RPM)任务。提供了深度神经模型和学习方法的分析,评估了现有方法的性能,并展示了实际问题如何受益于RPM研究的发现。
本研究提出了解决Pictionary问题的计算模型,使用固定问题和开放式语言形式的猜测单词,通过深度神经模型生成类似于人类的错误词汇,可用于类似游戏,并进行了比较和实验验证。
DeepISP是一种用于照相机图像信号处理的深度神经模型,能够完成从原始低光马赛克图像到最终具有视觉吸引力的图像的映射,并包括去马赛克、降噪以及色彩校正等任务。该解决方案在PSNR客观评估方面实现了最先进的性能,在主观人类评估和深度模型评分方面也具有更好的视觉质量。
完成下面两步后,将自动完成登录并继续当前操作。