链式思维(CoT)提示是引导大型语言模型推理的标准技术。本文分析了数学问题中的CoT轨迹及其对最终答案的影响,发现CoT的潜力与正确答案的可能性相关,表现出非单调性和难以解释的尖峰。此外,部分CoT显著提升了较弱模型的表现,表明其机制具有可转移性。
本研究提出了一种新型三维卷积神经网络模型SFR,旨在有效预测体外受精牛胚胎的可转移性,验证了其在生物学任务中的有效性和准确性。
匹兹堡大学与浙江大学合作开发了一种多通道预训练框架,旨在提升分子特性预测的准确性。该框架通过结合化学知识和结构层次,克服了现有分子机器学习方法的局限性,尤其在活性悬崖等复杂场景中表现优异。研究表明,该方法在微调过程中更好地保留了预训练知识,具备更强的可转移性和稳健性。
本研究探讨了图神经网络(GNN)在多图环境中的可转移性,特别是非可交换算子的影响。提出了图元组神经网络(GtNN)模型,并发展了相关数学理论,证明其在收敛图元组序列上的可转移性,实验验证了方法的稳定性。
本研究提出了一种新方法,通过对抗演化三角形增强视觉语言预训练模型的对抗样本多样性,解决其在多模态对抗样本下的脆弱性。该方法显著提高了对抗样本的可转移性,并通过理论分析和实验验证了其优越性。
本研究评估了五种基础模型在医学图像分类中的可转移性,发现DINOv2表现优异,而其他模型存在限制。通过FLAIR模型进行眼底图像分类的实验表明,直接迁移可提高性能。文章探讨了医学基础模型的应用与未来方向,强调其在提高诊断准确性方面的潜力。
本研究介绍了一种新颖的神经渲染方法,特别适用于对抗性伪装。该方法名为FPA,通过模拟光照条件和材质变化,实现对三维目标纹理的细致表达。实验证明FPA在攻击成功率和可转移性方面表现出强大性能,且贴纸模式伪装结合隐蔽约束可以适应环境,产生多样的纹理风格。
本文提出了一种多任务深度网络学习通用高级视觉表示的方法,通过训练人工制成的图像来克服真实与合成数据之间的领域差异。实验证明,该网络相比单任务基线学习到更具有可转移性的表示,能够产生最先进的迁移学习结果。
本文提出了一种新的方法ArCL,通过保证学习域不变特征,显着提高了对比学习的可转移性。实验证明,对比学习的下游表现在很大程度上取决于数据增强的选择。
该研究使用Army of Thieves(AOT)模型集成来作为盗贼模型,通过训练多个模型来利用人群的智慧,选择不确定样本进行查询。在CIFAR-10数据集上训练的模型的对抗样本可转移性比先前的研究提高了21%。
该研究评估了五种基础模型在医学图像分类任务中的可转移性,发现除了DINOv2表现出色外,其他模型未能始终超越基线,表明它们在医学图像分类任务中的可转移性存在限制。
本文提出了一种基于敏感性的技术,用于提取和对齐不同规模的大型语言模型之间的知识特定参数,并使用 LoRA 模块注入提取的知识到较小模型的中间机制。通过四个基准测试验证了该方法的有效性,凸显了模型参数在不同规模的大型语言模型之间的可转移性。
本文研究了多语言模型中去偏技术的可转移性,利用多语种 BERT,跨语言的去偏技术效果显著,特别是在低资源语言中。这些新的深入认识有助于对多语种语言模型中的偏见缓解有更深层次的理解,并提供了实践指导。
本文介绍了一种名为GFlowGNN的图主动学习方法,利用生成式流网络建模图,表现出良好的探索能力和可转移性。
通过学习六维受力和力矩的监督式变分自编码器,研究发现软式机器人手指的抓握知识在陆地和水下具有可转移性。训练的模型可以适应商用传感器环境的变化,提高了水下夹持器的可靠性和稳健性,降低了成本,为学习智能抓握和海洋研究提供了基础。
完成下面两步后,将自动完成登录并继续当前操作。