本研究提出了一种名为DoGEN的技术,旨在提高AI生成文本的检测效果。DoGEN通过集成多个领域专家模型,并利用领域分类器的权重,在内域检测中表现优异,并在外域检测中超越了规模更大的模型,显示出其在领域自适应检测中的潜力。
本文讨论了在检索增强生成(RAG)系统中对大型语言模型(LLM)进行微调的重要性。微调能够提升模型在特定领域的准确性和相关性,尤其是在处理专业术语和推理方面。文章介绍了领域自适应预训练、检索增强微调和混合微调等策略,强调这些方法如何帮助LLM更有效地利用检索信息,从而提高生成响应的质量。
本研究提出了一种名为SPILL的领域自适应聚类方法,旨在解决现有意图聚类在新领域数据集中的局限性。该方法无需微调,显著提升了嵌入模型的适应性和聚类性能。
本研究提出LangDA方法,解决无监督领域自适应语义分割中的知识转移和空间关系捕捉问题。实验结果表明,该方法在DASS基准测试中表现优异,超越了以往的技术。
本研究提出FINDAP方法,解决金融领域大语言模型的领域自适应后训练挑战。通过识别核心能力并构建评估体系,采用数据蒸馏训练方案,使模型Llama-Fin在多项金融任务中表现优异,为LLM领域适应提供了重要见解。
该研究提出了一种双重概率对齐框架,有效解决了领域自适应物体检测中的开放集、部分集和闭合集域适应性问题,显著提升了检测性能。
本文提出了一种领域自适应方法,通过无监督训练样本中的领域信息构建模型,提升未见领域的预测能力。该方法在多个领域泛化基准上表现优异,并引入了大规模基准Geo-YFCC,实现了显著优化。
本研究提出了一种策略,通过领域自适应持续预训练开发特定领域的大型语言模型,介绍了应用于金融领域的FinPythia-6.9B。FinPythia在金融任务中表现优异,并探索了高效的数据选择策略。相比传统方法,该策略在使用更少资源的情况下表现更好,同时不影响开放领域任务。
本文综述了使用深度迁移学习和领域自适应方法来理解三维点云的最新技术,包括知识转移策略、性能评估,以及在各个应用领域上的应用。同时指出了现有框架的优势、局限性,并提出了潜在的研究方向。
该研究将预训练的神经语言模型与$k$最近邻居模型线性插值,提高了Wikitext-103 LM的困惑度2.9点至15.79,无需额外训练。该方法在扩展到更大的训练数据和实现领域自适应方面也表现出良好效果。作者认为最近邻搜索是长尾系统的有效语言建模方法。
本文介绍了LLaVO视觉跨域学习器,使用语言模型将图像转换为文本描述,并在源/目标领域生成的文本描述上进行微调。实验证明该方法在领域概括和无监督领域自适应设置下有效。
本文介绍了一种名为SR-Stereo的新型立体匹配方法,通过预测视差剪辑和使用与回归目标尺度相关的损失权重来缓解不同数据集之间的分布差异。同时,提出了基于预训练边缘的领域自适应(DAPE)来解决粗糙地面实况模型的边缘模糊问题。实验结果表明,SR-Stereo在视差估计性能和跨领域推广性能方面具有竞争力,DAPE显著改善了无纹理和细节区域的精调模型的视差估计性能。
本论文提出了基于领域自适应的方法,利用无监督训练样本中的领域信息构建领域自适应模型,用于未见过领域的预测任务。该方法在各种领域泛化基准上表现出最先进的性能,并引入了新的大规模领域泛化基准Geo-YFCC。
我们提出了一个两阶段框架,利用伪标签进行领域自适应,以提高从 CT 扫描中检测 COVID-19 的速度和准确性。该模型通过利用一个领域的注释数据和另一个领域的非注释数据,克服了数据稀缺和变异挑战。实验结果展示了该模型在高诊断精度方面的潜力,有助于高效的患者管理和减轻医疗系统的压力。
通过引入双向多级时空融合模块和类别感知的时空特征对齐模块,提出了一种新颖的DA-STC方法来解决视频语义分割任务中的领域自适应问题,并在多个具有挑战性的基准测试上取得了最先进的mIOUs。
本研究通过预训练语言模型和领域自适应策略,使用增量自我训练方法提高了时间序列文本分类的准确性。研究结果显示增量方法在适应变化领域方面表现出色,超过了传统的领域自适应技术。研究强调了更新预训练语言模型以确保其在实际应用中有效性的重要性,并为未来研究预训练语言模型在语言演变中的鲁棒性提供了基础。
该研究提出了一种无监督方法,使用预训练的Transformer和序列去噪自编码器,性能优于先前的方法高达6.4个点,可达到领域内监督方法的93.1%。TSDAE是一种强大的领域自适应和预训练方法,优于其他方法,并在四个不同数据集上进行了评估。
该文介绍了$k$NN-LMs模型,将预训练的神经语言模型与$k$最近邻居模型线性插值,实现了一个新的最先进的困惑度为15.79,无需额外训练。作者认为这种方法在扩展到更大的训练数据和实现领域自适应方面具有作用,并在长尾系统的语言建模中是一种有效的方法。
该文提出了半监督领域通用目标检测(SS-DGOD)和弱监督领域通用目标检测(WS-DGOD)两种新的问题设置,利用师生学习框架在多个领域的无标记或弱标记数据进行训练。研究表明,在此设置下训练的目标检测器明显优于基线检测器,并且与无监督领域自适应(UDA)设置下训练的目标检测器性能相媲美或更好,同时不需要使用目标领域数据进行训练。
完成下面两步后,将自动完成登录并继续当前操作。