本研究提出了一种基于强化学习的微调框架,旨在提高数据到方程任务中的领域适应性和生成方程的准确性。该方法通过优化预训练模型的生成策略,尤其在复杂数据分布下展现出显著的潜力。
本研究提出了一种新颖的两阶段微调框架LMM-RGCL,旨在提升大型多模态模型在仇恨谣言检测中的泛化能力。实验结果表明,该框架在多个数据集上表现优异,超越了现有模型。
本研究提出了一种新的长输入微调框架(LIFT),旨在解决大型语言模型在长上下文理解中的挑战,提升其在相关任务中的表现,并减轻计算负担。
本文探讨了大型语言模型(LLM)在金融领域的应用,提出了多专家微调框架和新型提示技术,以提升模型在金融推理和数据处理中的表现。研究表明,经过微调的模型在多个基准测试中优于通用模型,并通过生成合成数据有效提升了性能。此外,使用外部工具增强模型可缓解误差,提升准确性。
本文介绍了一种新颖的微调框架,旨在提升Segment Anything Model(SAM)在医学图像分割中的性能。通过批量提示策略和自我提示,研究发现适当的提示能显著改善SAM在不同数据集上的表现。提出的PromptUNet模型结合多种提示类型,实验结果表明其在医学图像分割中的精度优于现有主流方法。
规模化预训练视觉模型(PVMs)在视觉任务中表现优异,但传统微调方法面临计算和存储的挑战。研究人员探索了参数高效微调(PEFT),通过最小化参数修改来提升性能。文章回顾了PEFT的定义、方法分类及应用,强调其在医学图像分析和机器翻译中的有效性,并提出了新的微调框架和算法,展示了PEFT在不同任务中的潜力与挑战。
本文介绍了一种针对大型语言模型(LLM)的差分隐私(DP)微调框架ewtune,能够有效降低噪声影响并提升自然语言理解任务的性能。同时,研究提出了隐私保护语言模型(PPLM)及其他技术,以保护数据隐私并提高模型性能,并探讨了差分隐私与公平性之间的关系。
完成下面两步后,将自动完成登录并继续当前操作。