本研究提出了一种名为SSLR的半监督学习方法,旨在解决手语识别系统中标注数据稀缺的问题。通过为未标注样本生成伪标签,SSLR在使用较少标注数据的情况下,性能超过全监督学习模型,显示出在手语识别领域的潜力。
该研究采用大规模弱监督学习方法,解决阿拉伯语语音识别中的标注数据不足问题。训练的ASR模型在缺乏人工标签的情况下,仍在标准测试中表现优异,验证了弱监督学习在低资源环境中的有效性。
本研究提出了一种名为SeLIP的对比学习框架,旨在解决医学图像分析中的标注数据不足问题。通过结合图像和放射学发现,增强了对比学习。实验结果表明,该模型在图像-文本检索、分类和图像分割等任务中表现优异,强调了文本相似性在医学图像基础模型构建中的重要性。
本研究提出CBVLM方法,旨在解决医学图像分类中的标注数据不足和缺乏可解释性的问题。该方法利用大规模视觉语言模型的少量学习能力,降低标注成本并确保诊断可解释性。实验结果表明,CBVLM在多个医学数据集上表现优异,超越传统方法。
本研究提出PEIT框架,以解决分子生成任务中的标注数据不足和多属性约束问题。实验结果显示,PEIT在分子描述生成和多任务生成方面表现优异,验证了其广泛适用性。
本文研究了自我演变训练在多模态推理中的应用,提出了最佳实践以解决标注数据不足的问题,优化了训练方法和奖励模型,开发了MSTaR框架,使模型在多个基准上显著提升,填补了该领域的理解空白。
本研究提出了一种基于条件生成对抗网络(ConGAN)和迁移学习框架(T-ConGAN)的方法,旨在解决家庭独特空间特性导致的标注数据获取困难,显著提升室内定位性能,尤其在楼梯和户外等挑战区域。
本研究针对机器学习中的概念漂移问题,提出了无监督漂移采样策略(SUDS)和统一标注数据准确性指标(HADAM),以提升模型的适应能力和标注数据的使用效率。
本研究推出了SciER数据集,旨在解决现有科学信息提取数据集的注释局限。该数据集包含106篇完整科学论文的标注数据,涵盖与数据集、方法及任务相关的实体,并引入细粒度关系标签,以促进模型评估和SciIE领域的发展。
本研究提出了一种基于大型语言模型的命名实体识别框架LLM-DER,解决了煤化工领域NER中缺乏标注数据的问题。实验结果表明,LLM-DER在领域特定实体识别中表现优异,验证了其有效性。
本研究针对人际对话摘要的准确性和信度不足问题,提出了一种新评估标准,并提供了增强标注数据的新版本。研究表明,整合任务相关信息的模型显著提高了摘要质量。
本文探讨了多种基于扩散模型的语义分割方法,如PNS-Net、DiffSegmenter和VD-IT。这些方法在视频物体分割和开放词汇语义分割任务中表现优异,能够有效利用少量标注数据,提升分割性能,并在多个数据集上取得了先进的结果。
本文比较了模型微调和检索增强生成(RAG)两种提升语言模型性能的方法。微调需要大量标注数据,而RAG结合了检索和生成,不需要标注数据。微软的实验结果显示,RAG相比微调具有显著优势,可能是因为RAG能丰富模型知识并结合问题上下文。然而,RAG与微调结合并不总是胜过单一的RAG或微调方法。
实验结果显示,小模型在专家注释下以较少标注数据胜过GPT-3.5,与GPT-4性能相当或超过,尽管规模只有后者的百分之一。因此,认为大型语言模型可作为预热方法,通过领域专家数据注释实现任务成功。
该文提出了一种新颖的逐轮主动学习框架,用于对话状态跟踪。通过主动选择对话中的轮次进行注释,解决了收集大量逐轮标注对话数据的高成本和低效率问题。实验结果表明选择性注释对话轮次的有效性,同时使用显著较少的标注数据,可以实现与传统训练方法相当的DST性能,为注释新的对话数据提供了更高效的方式。
本文介绍了一种基于物理学信息神经网络(PINN)的方法,用于解决没有标注数据的弹性动力学建模问题。该方法解决了弱正则化PINN框架下复杂的I/BCs问题,并在多个数值弹性例子中展示了其可行性。
完成下面两步后,将自动完成登录并继续当前操作。