本文总结了2025年5月10日发布的十六篇计算机视觉研究论文,重点讨论了可解释性、弱监督学习、模型效率和安全性等主题。这些研究推动了计算机视觉的理论与实践发展,并促进了其在医疗和安防等领域的应用。
该研究采用大规模弱监督学习方法,解决阿拉伯语语音识别中的标注数据不足问题。训练的ASR模型在缺乏人工标签的情况下,仍在标准测试中表现优异,验证了弱监督学习在低资源环境中的有效性。
本文探讨了弱监督学习在多实例部分标签学习中的可解释性和可靠性问题。通过引入归纳逻辑编程,提出了一种神经符号框架,增强了模型的结构性和学习指导,提高了模型的稳健性和透明度,确保神经网络的预测符合领域知识,适用于高风险应用。
本研究提出了一种弱监督学习方法,旨在降低现代搜索引擎构建标注数据集的时间和成本。该方法通过推断查询-文档对的质量,应用于学习排序框架,从而显著提高大规模搜索系统的精度。
故障定位在软件开发中至关重要,Bug Attention Probe(BAP)通过弱监督学习提高了故障定位的准确性和效率,尤其在多行错误处理上表现突出。随着软件复杂性增加,机器学习与大型语言模型的结合将进一步推动故障定位的发展,提升软件质量和可靠性。
本文研究了在弱监督学习中利用多种标注形式(如点、水平框、旋转框)提升定向物体检测性能。提出的Wholly-WOOD框架表明,仅用水平框训练即可接近旋转框模型的效果,显著降低对旋转标注的依赖,为定向物体检测提供了新方向,尤其在减少标注成本方面具有重要意义。
本研究提出了Point2RBox-v2方法,解决了基于点标注的定向物体检测中的实例空间布局问题。通过引入多种损失函数,该方法在密集场景中的检测精度达到62.61%/86.15%/34.71%。此研究为弱监督学习提供了新思路,具有重要的应用潜力。
本研究提出了一种双流膨胀3D卷积网络的弱监督学习框架,旨在提升城市监控系统中的异常检测技术,增强准确性并减少人工标注需求。
3D医学图像分割面临挑战,深度学习虽然提升了完全监督方法,但仍需大量注释。为此,提出了一种概率感知的弱监督学习流程,结合伪标签生成、概率多头自注意网络和基于概率的损失函数,显著提升了分割性能,尤其在CT和MRI数据集上,某些器官的Dice得分提高了18.1%。
本研究提出了交互式学习框架INTERVAL,解决了弱监督学习中数据标注成本高的问题。INTERVAL通过优化专家有限时间的利用,提高了多个数据集上的F1值。仅需10次专家反馈查询便能达到现有主动学习方法100次查询所无法匹配的F1值。
本研究提出了一种新的上下文感知弱监督学习方法,通过深度网络结合物体细化和实体关系建模,提高物体表述和匹配准确性。实验结果显示,该方法在Flickr30K和ReferItGame数据集上具有更好的算法性能。
本文提出了一种基于弱监督的学习方法,将图像视为一个包中的实例,融入深度神经网络中,实现对象分类和发现任务。在PASCAL VOC数据集上测试,该方法在对象分类和发现方面表现出色,且速度更快。
该研究提出了一种新的视频分类和定位方法,使用弱监督学习从视频级标签中定位对象,并通过使用伪标签进行训练来提高定位准确性。实验结果表明,该方法在YouTube-Objects无约束视频数据集上取得了最佳分类和定位的性能表现。
本研究提出了一种动态交互学习框架,通过将交互式分割与弱监督学习和流式任务集成,解决了医学图像自动分割系统的挑战。该框架减少了标注工作量,生成了具有竞争力的结果,并可在医院防火墙后部署。
本文提出了一个高效的算法,通过利用不完全的标签比例解决了整个切片图像中肿瘤亚型的分割问题。该算法将问题分解为两个弱监督学习子问题,并从标签比例中学习,有效地进行优化。实验证明了该算法的有效性。
本研究提出了一种动态交互学习框架,通过将交互式分割与弱监督学习和流式任务集成,解决了医学图像自动分割系统的挑战。该框架减少了标注工作量,并生成了具有竞争力的结果。此外,该框架可以在医院防火墙之后部署。
本研究使用分层结构化数据帮助神经网络学习大教堂概念表示,并通过新的分层对比训练方法在编码器的潜在空间中表示数据的空间层次结构。结果表明该方法优于其他对比学习方法,数据集结构是弱监督学习中有价值的模态。
该论文介绍了一种通用框架,通过期望最大化方法处理弱监督学习,提出了一种简化计算需求、提高机器学习模型可扩展性和性能的先进算法。
本研究提出了一种新的上下文感知弱监督学习方法,通过深度网络细化物体并建模实体关系,实现更准确的物体表述和匹配。实验证明该方法在Flickr30K和ReferItGame数据集上具有更好的性能。
完成下面两步后,将自动完成登录并继续当前操作。