本文介绍了一种新的两阶段弱监督方法,通过亚像素级细胞核标记实现亮场显微镜图像的三维细胞实例分割。该方法减少了数据收集和标注工作量,适用于多种3D细胞成像模式。同时,提出的CellMixer无标注方法和NuSegDG框架提升了细胞核分割的准确性和泛化能力,展示了在医学成像和细胞生物学中的应用潜力。
本文探讨了通过引入可解释的时空注意力机制和多任务学习来提升视频动作识别的准确性和模型解释性。研究表明,弱监督方法和运动注意力算法能有效提高视频显著对象检测和动作识别的性能,尤其在多个数据集上取得了先进的结果。
GMMSeg提出了一种新型分割模型,利用密集生成分类器捕获类条件密度,优于传统鉴别模型。研究还展示了基于高斯混合模型的可解释分割网络,以及结合CNN和弱监督方法的语义分割分类器,均在多个数据集上取得了良好效果。
该研究提出了一种分阶段的自我训练框架,利用伪掩模和多任务模型来提升半监督语义分割的性能。实验结果显示,在PASCAL VOC 2012和ISIC 2018数据集上,相较于现有方法有显著提升。同时,研究探讨了弱监督方法和简化网络架构的有效性,强调在有限资源下实现高质量分割的潜力。
本文探讨了多种牙齿分割技术,包括弱监督方法、3D变换器架构和基于生成图像的框架,旨在提高牙齿分割的精度和效率,强调其在牙科应用中的临床适用性和成本效益。
研究者提出了一种弱监督方法,利用音频和文本嵌入之间的相似性,通过重构文本和解码音频嵌入来训练模型,减轻了对配对目标数据的需求。实验证明,该方法在两个数据集上的性能达到了83%。
该文介绍了一种新颖的弱监督引用图像分割(RIS)框架,利用引用文本信息定位目标物体。该框架具有三个创新点,优于最新弱监督方法。
该研究提出了一种弱监督方法,利用稀疏语义地图和文本描述或属性来控制对象的形状和类别,以及局部和全局风格,同时引入语义注意力模块来支持文本描述的条件。为了增强场景的可控性,提出了一个两步生成方案来分解背景和前景。
该文介绍了一种弱监督方法来训练自动音频字幕生成(AAC)模型,只需要文本数据和经过预训练的对比语言音频预训练(CLAP)模型,从而减轻了对配对目标数据的需求。该方法利用 CLAP 中音频和文本嵌入之间的相似性,通过桥接差距的策略减小音频和文本嵌入之间的模态差距。在 Clotho 和 AudioCaps 数据集上评估,相对于使用配对目标数据训练的完全监督方法,该方法可达到高达 83% 的性能水平。
本文研究了LLMs在虚假信息检测中的应用,使用18个可信度信号产生弱标签,并使用弱监督方法预测内容真实性。该方法在两个虚假信息数据集上性能优于现有分类器,同时分析了可信度信号对内容真实性预测的贡献,为虚假信息检测提供了新的见解。
本研究提出了Patch-GCN算法,用于预测肿瘤微环境的拓扑结构和患者生存预后。通过4,370张WSIs验证,Patch-GCN在5种癌症类型中表现优于之前的弱监督方法。
完成下面两步后,将自动完成登录并继续当前操作。