本研究探讨了Whisper ASR模型在自动语音识别中的幻觉问题,分析了不同声音诱导的幻觉,并提出了幻觉袋后处理方法,有效降低了字错误率。
本研究探讨了深度神经模型在自然语言生成中产生虚假信息的原因,并提出了一种扩展的束搜索算法以减少虚假信息。研究表明,预测不确定性与虚假信息相关,认知不确定性更能指示虚假信息。通过分析生成的输入和输出,开发了分类器以区分幻觉与非幻觉生成,从而提升生成内容的可信度。
本文总结了深度学习在抽象视觉推理领域的应用研究进展,重点关注了瑞文渐进矩阵(RPM)任务。提供了深度神经模型和学习方法的分析,评估了现有方法的性能,并展示了实际问题如何受益于RPM研究的发现。
本研究提出了解决Pictionary问题的计算模型,使用固定问题和开放式语言形式的猜测单词,通过深度神经模型生成类似于人类的错误词汇,可用于类似游戏,并进行了比较和实验验证。
DeepISP是一种用于照相机图像信号处理的深度神经模型,能够完成从原始低光马赛克图像到最终具有视觉吸引力的图像的映射,并包括去马赛克、降噪以及色彩校正等任务。该解决方案在PSNR客观评估方面实现了最先进的性能,在主观人类评估和深度模型评分方面也具有更好的视觉质量。
完成下面两步后,将自动完成登录并继续当前操作。