小红花·文摘

计算机视觉前沿：深度人工智能时代的可解释性、效率、鲁棒性与统一学习

DEV Community ·

该研究采用大规模弱监督学习方法，解决阿拉伯语语音识别中的标注数据不足问题。训练的ASR模型在缺乏人工标签的情况下，仍在标准测试中表现优异，验证了弱监督学习在低资源环境中的有效性。

Advancing Arabic Speech Recognition Through Large-Scale Weakly Supervised Learning

BriefGPT - AI 论文速递 ·

本文探讨了弱监督学习在多实例部分标签学习中的可解释性和可靠性问题。通过引入归纳逻辑编程，提出了一种神经符号框架，增强了模型的结构性和学习指导，提高了模型的稳健性和透明度，确保神经网络的预测符合领域知识，适用于高风险应用。

神经符号弱监督：理论与语义

BriefGPT - AI 论文速递 ·

本研究提出了一种弱监督学习方法，旨在降低现代搜索引擎构建标注数据集的时间和成本。该方法通过推断查询-文档对的质量，应用于学习排序框架，从而显著提高大规模搜索系统的精度。

Weak Supervision for Improved Precision in Search Systems

BriefGPT - AI 论文速递 ·

掌握故障定位：错误检测技术的未来

DEV Community ·

本文研究了在弱监督学习中利用多种标注形式（如点、水平框、旋转框）提升定向物体检测性能。提出的Wholly-WOOD框架表明，仅用水平框训练即可接近旋转框模型的效果，显著降低对旋转标注的依赖，为定向物体检测提供了新方向，尤其在减少标注成本方面具有重要意义。

Wholly-WOOD: Comprehensive Utilization of Diversified Quality Labels for Weakly Supervised Oriented Object Detection

BriefGPT - AI 论文速递 ·

本研究提出了Point2RBox-v2方法，解决了基于点标注的定向物体检测中的实例空间布局问题。通过引入多种损失函数，该方法在密集场景中的检测精度达到62.61%/86.15%/34.71%。此研究为弱监督学习提供了新思路，具有重要的应用潜力。

Point2RBox-v2: Rethinking Instance Spatial Layout in Point-Supervised Oriented Object Detection

BriefGPT - AI 论文速递 ·

本研究提出了一种双流膨胀3D卷积网络的弱监督学习框架，旨在提升城市监控系统中的异常检测技术，增强准确性并减少人工标注需求。

Weakly Supervised Anomaly Detection in Surveillance Videos Based on Dual-Stream I3D Convolutional Networks

BriefGPT - AI 论文速递 ·

本文探讨了深度学习在心脏影像分割中的应用，提出了多种自监督和弱监督学习方法，显著提高了心脏MRI和超声图像的分割精度。这些新算法在数据利用效率和诊断准确率上优于传统方法，为心血管疾病的诊断和治疗提供了重要支持。

心脏MRI中的少样本分割高斯过程仿真器

BriefGPT - AI 论文速递 ·

该研究提出了多种方法以提高3D视觉定位的准确性，包括2D语义辅助训练、语言引导物体检测和基于多视角变换器的方法。通过引入弱监督学习和密集三维视觉接地网络，研究在不同数据集上展示了显著的性能提升，并探讨了文本引导的三维视觉定位的进展与未来方向。

用于3D视觉定位的细粒度空间和语言损失

BriefGPT - AI 论文速递 ·

本文介绍了一种新的视觉关系建模方法，利用弱监督学习从图像级标签中学习关系，并提出了UnRel数据集用于评估。实验结果表明，该模型在视觉关系检索中显著提高了性能，验证了其有效性。

RelationBooth：面向关系感知的定制对象生成

BriefGPT - AI 论文速递 ·

本文介绍了一种结合prompt learning和GPT-4的few-shot弱监督学习方法，用于病理全幻灯片图像分类。提出的MI-Zero框架和CONCH模型在组织病理学图像任务中表现优异，无需额外标签。同时，研究提出的CPLIP技术通过无监督学习增强图像与文本的对齐，显著提升了分类和分割任务的性能。这些方法在医学图像分析中展现了强大的潜力和可解释性。

MI-VisionShot：用于组织病理图像滑动级分类的视觉语言模型少量学习适应

BriefGPT - AI 论文速递 ·

本文提出了一种弱监督学习方法用于医学图像分割，结合预训练深度卷积网络和多实例学习，在缺乏像素级注释的情况下实现高性能。通过使用Segment Anything Model（SAM）生成伪标签，研究表明该方法在多个数据集上显著提高了分割精度，减少了人工标注工作量，同时保持与全监督方法相当的准确性。

基于“分段任何事物”的增强提示弱监督癌症分割

BriefGPT - AI 论文速递 ·

本文介绍了一种新颖的few-shot分割模型，通过结合基础学习器和元学习器的预测，提升了模型的泛化性能和分割准确率。实验结果表明，该方法在多个数据集上表现优异，尤其在增量学习和弱监督学习场景中，有效解决了新类别学习和旧类别遗忘的问题。

增量少样本语义分割的一致性原型学习

BriefGPT - AI 论文速递 ·

本文介绍了一种变分贝叶斯方法和多种神经网络模型，用于上下文建模和图像中的对象定位。这些模型在多个数据集上表现优异，具有高效性和可解释性，特别是在弱监督学习和多模态交互方面，推动了自然语言处理与计算机视觉的结合。

通过渐进理解提升弱监督指向图像分割

BriefGPT - AI 论文速递 ·

本文介绍了多种基于大型语言模型（LLMs）的规划方法，包括DDN框架、LLM-Planner和SimPlan，旨在解决复杂任务的过程规划问题。研究表明，结合视觉信息和弱监督学习可以提升规划性能，尤其在教学视频中。CLIPS模型通过贝叶斯推理实现灵活的指令跟随，RAP模型通过自适应方法优化过程规划，MM-PlanLLM增强了多模态输入输出的处理能力。

提议、评估、搜索：利用大语言模型实现教学视频中的目标导向规划

BriefGPT - AI 论文速递 ·

本研究提出了一种结合CNN和弱监督学习的语义分割方法，通过显著性和注意力地图提升性能，无需精确标签。采用新损失函数和对比学习解决数据不平衡问题，增强模型鲁棒性。同时，研究关注长尾语义分割，提出改进算法和评估系统，推动相关领域的实证研究。

AUCSeg：面向AUC的像素级长尾语义分割

BriefGPT - AI 论文速递 ·

本文提出了一种基于弱监督学习的少样本远程感知图像语义分割方法，包含“上下文感知原型学习（CAPL）”和“自相关与交叉相关学习网络”，显著提升了新类别分割的性能。该方法在多个数据集上表现优越，适用于高分辨率土地覆盖映射。

遥感中的广义少样本语义分割：挑战与基准

BriefGPT - AI 论文速递 ·

本文介绍了DBPal工具，该工具通过自然语言界面将问题转化为SQL查询，从而提升用户的查询效率。文章还讨论了FollowUp数据集、FANDA方法及多种自然语言数据库接口的评估，强调了弱监督学习在SQL解析中的应用及未来研究方向。

SQLucid：通过互动解释实现自然语言数据库查询的基础

BriefGPT - AI 论文速递 ·

本文介绍了一种基于视觉的地面车辆定位方法，利用卫星图像和神经网络模型消除视角差异。该方法在不同环境中实现了高精度定位，显著降低了定位误差，并提出了新的图像检索流程和弱监督学习方法，以提升定位准确性。

弱监督摄像头定位通过地面到卫星图像匹配

BriefGPT - AI 论文速递 ·