本文针对临床试验设计中的资源消耗和效率问题,提出了一种新的半监督方法,以识别相似的历史临床试验。这一方法通过总结临床试验方案,并基于查询试验的方案进行相似试验搜索,显著提高了信息检索的准确性,具有重要的应用潜力,有助于降低试验设计中的风险,提高成功率。
本研究提出了一种名为SpectMamba的半监督歌唱旋律提取网络,旨在解决现有方法的低效率和标注数据不足的问题。通过引入视觉Mamba和置信二元正则化模块,该方法在多个公共数据集上取得了优异的表现。
本研究针对网络中重叠结构的社区检测挑战,提出了一种结合图多头注意力和模块化最大化的半监督图自编码器,以有效检测重叠社区。研究发现,这种新颖的抗噪声架构及语义半监督设计显著提升了重叠社区检测的质量,尤其在属性噪声的情况下,模型表现出卓越的鲁棒性,维护在60%特征损坏下的稳定性能。
本研究解决了电子元件过时预测中的数据稀缺问题,通过深度生成建模生成新的过时案例以扩充训练数据集。提出的框架在增强的数据集上训练经典的机器学习预测模型,并在基准数据集上展现出最先进的效果,潜在地推动工业应用的过时管理。
本研究提出CLique ANNealing(CLANN)方法,解决了半监督社群检测中的核心候选选择不合理和可扩展性差的问题。通过结合结晶动力学,CLANN优化社群核心一致性,提高了算法的效率和效果。实验结果表明,CLANN优于现有方法。
本文提出了一种新颖的框架,将集成学习与增强图结构相结合,以提高图中半监督节点分类的性能和鲁棒性。该方法通过创建同一图的多个增强视图,利用“多样性人群的智慧”,有效缓解嘈杂图结构带来的挑战,并在多个真实世界数据集上的实验表明了其有效性。
本研究旨在解决现有半监督医学分割方法中存在的伪标签噪声问题,特别是在牙齿点云分割的背景下。提出的GeoT框架通过实例依赖过渡矩阵(IDTM)明确建模伪标签中的噪声,并引入几何先验以优化估计。实验结果表明,该方法能够充分利用未标记数据,实现与完全监督方法相当的性能,仅需20%的标记数据。
本研究提出UPC-SC方法,旨在解决半监督领域泛化中的训练与测试数据分布差异,充分利用低置信度无标签样本,显著提升模型性能,缩小领域间差距。
本研究针对半监督学习(SSL)在视觉基础模型(VFM)中的应用不足,提出新的基准数据集并系统评估多种SSL方法。关键发现是,仅用标记数据的参数高效微调(PEFT)方法能与SSL性能相匹配,此结果促使我们改进自训练方法,通过多种PEFT模型的集成,生成更稳健的伪标签,提供了SSL与VFM结合的新见解。
本研究提出NodeReg方法,通过范数一致性减轻半监督节点分类中的不平衡和分布偏移影响,提升了图神经网络(GNN)的泛化能力和分类性能。实验结果表明,NodeReg在这些情况下优于现有基线。
本研究解决了现有研究在上下文学习中数据选择偏重于真实注释示例而忽视自生成注释可靠性的问题。我们提出了一种三步半监督上下文学习框架,基于高置信度自生成示例提升ICL表现,实验结果显示,该基准方法在16个数据集上平均提升了9.94%。此外,我们引入了IterPSD方法,通过迭代优化伪示例,进一步提升分类任务精度,并揭示了当示例数量超过1000时半监督上下文学习的最佳性能规律。
本研究提出了一种CRTrack半监督多目标跟踪方法,旨在解决低光照环境下数据集不足和注释成本高的问题,增强模型对噪声伪边框的抵抗力,从而显著提升跟踪性能。
本研究针对半监督语义分割中的常见问题,如过度依赖标记数据导致的耦合现象、确认偏差以及边界模糊等,提出了一种新颖的CW-BASS框架。该方法通过对伪标签赋予置信度权重来降低错误预测的影响,并利用边界感知模块提高分割精度,为标记数据不足的情况下的语义分割提供了有效的解决方案。
本研究提出了一种协作矫正学习网络,用于半监督三维医学图像分割,旨在有效利用少量标注数据和大量未标注数据。通过生成高质量伪标签和引入动态交互模块,提升了模型在不确定区域的分类能力。实验结果表明,该方法在公共数据集上优于现有技术,具有良好的推广潜力。
本文提出了一种新框架,将深度预训练的Transformer语言模型与生成对抗网络结合,以解决数据稀缺下文本生成模型的性能问题。研究表明,该半监督方法能有效提升文本生成的质量和多样性。
本研究解决了手动标注成本高和模型性能不足的问题,提出了一种新颖的主动学习方法,并结合了改进的半监督学习框架。该方法能够有效利用通过主动学习选择的标记数据和未纳入选择过程的未标记数据,显著提升了语义分割任务的表现,并在两个基准数据集上超越了现有最先进的方法。
本研究针对强化学习中奖励信号稀疏这一问题,通过结合半监督学习技术和新颖的数据增强方法,从大多数过渡中学习轨迹空间表示,从而改善奖励塑造的有效性。实验结果表明,该方法在稀疏奖励场景下的表现显著优于基于好奇心的方法,最高得分提高了四倍,并且使用的双重熵数据增强方法相比其他方法将最高得分提升了15.8%。
本研究针对当前注意力机制在自然语言处理中的解释性问题,提出了改进注意力图可信性的三种约束方法:正则化、半监督和人工监督。研究表明,这些技术在一定程度上提高了注意力图的可信性,但特定的人工标注指令可能会对分类性能产生负面影响。同时,实验结果显示上下文层对搜寻可信标记空间至关重要。
本研究通过微调Whisper模型和大语言模型后期编辑,显著提高了爱沙尼亚电视字幕的质量,接近人类标准,并可扩展至实时应用。
本研究解决了联邦半监督学习中标注数据稀缺和客户数据非独立同分布的问题。提出的扩散模型辅助的FSSL方法通过生成合成数据来弥补不同客户间的数据异质性,并能有效改善准确率,实验显示在CIFAR-10数据集上,从10%的标注数据情况下,准确率提高了近14%。
完成下面两步后,将自动完成登录并继续当前操作。