当前大型语言模型主要以英语为主,导致多语言输出不自然。本文提出新的自动化语料库评估指标,评估多语言环境下LLM输出的自然性,并在法语和中文中进行测试,发现英语影响的模式。为改善这一问题,提出了一种简单有效的对齐方法,提升目标语言的自然性,同时不影响通用基准的表现。
本研究探讨了大型语言模型(LLMs)与人类价值观的一致性,指出现有对齐方法仅提供局部安全,仍存在有害知识。通过分析验证,模型在对抗性诱导下表现出脆弱性,攻击成功率可达100%。
本研究探讨了人工通用智能(AGI)安全开发中,依赖共识的对齐方法无法识别新解决方案的问题。提出的功能性认识闭合模型揭示了认知、制度和社会过滤器如何影响对齐提案的理解,缺乏递归模型可能导致不可逆的失调风险,影响AGI的安全开发。
本研究提出了 extsc{AlignX}数据集及两种对齐方法,解决了大型语言模型在用户偏好对齐中的单一标准化问题,实验结果显示准确率提高了17.06%。
本书探讨大型语言模型的基本概念,分析预训练、生成模型、提示技术和对齐方法,旨在帮助自然语言处理领域的学生和从业者理解这一快速发展的领域。
本研究提出了一种新颖的对齐方法——逐步扩散策略优化(SDPO),有效解决了现有对齐方法在少步扩散模型中的泛化不足问题。实验结果表明,SDPO在奖励基础对齐方面优于以往方法,展现出强大的泛化能力。
本文探讨了大型语言模型(LLM)的对齐方法,提出了URIAL、Aligner和LongAlign等新技术,显著提升了微调和长篇背景处理的性能。研究强调了对齐分析的重要性,并提出了经济高效的对齐替代方案PreTTY,推动多语言LLM的发展。此外,选择性调优关键层可提高微调效率。
本文介绍了一系列支持高达32,768个令牌的长上下文大型语言模型(LLMs),通过持续预训练和长文本数据集,这些模型在长上下文任务上相较于Llama 2有显著提升。研究分析了对齐方法和长上下文能力的增强技术,提出了LongAlign框架和GATEAU框架,显著提高了模型在长篇背景任务中的性能。
本研究提出了GenARM,一种基于自回归奖励模型的高效对齐方法,旨在解决大型语言模型与人类偏好对齐的成本和效率问题。实验证明,GenARM在性能上显著优于传统方法,并支持多目标对齐,以满足用户的多样化需求。
本文探讨了大型语言模型(LLMs)与人类偏好的对齐方法,包括点对点偏好学习、奖励模型优化和软偏好优化。研究表明,利用奇异值分解和联合指导-回应偏好数据等技术,可以显著提升模型的对齐效果,增强与人类偏好的匹配。
本文探讨了大型语言模型(LLMs)与人类偏好的对齐方法,提出了基于贝叶斯推理的d-PM模型和主动选择提示的APO算法,以提高偏好数据的收集效率和质量。这些方法旨在克服传统强化学习的局限性,确保生成的响应更符合人类偏好,从而提升模型的安全性和实用性。
本文研究了大型语言模型中的遗忘机制,提出三种对齐方法以删除有害回应、版权内容和幻觉。通过引入轻量级的取消学习层,框架有效更新模型,解决用户隐私问题。研究表明,结合梯度上升与下降的方法能提升模型性能,推动道德AI实践的发展。
本研究探讨了对齐方法在不同情境下的表现,发现小规模训练数据在数学问题解决中效果最佳。提出了长期记忆对话(LeMon)任务,并构建了具长期记忆机制的对话生成框架PLATO-LTM,显著提升了对话一致性。此外,研究了基于大型语言模型的对话状态跟踪和记忆管理,提出了逐步DPO方法,提升了模型性能。
本文研究了大型语言模型(LLM)的对齐方法,分析了对齐数据集和技术对模型性能的影响。研究表明,较小训练数据子集中的对齐方法在数学问题解决中效果最佳。提出了一种基于蒸馏的多模态对齐模型,增强了语言能力,并通过细粒度监督提升了模型性能。此外,提出了一种参数高效的对齐方法(MEET),显著提高了可控生成质量,强调了对人类偏好的对齐对模型安全性的重要性。
本文提出了一种新的参数高效的跨语言转移学习框架,通过基于翻译的对齐方法来减少多语言差异,并采用微调方法来提高效率。实验证明,该框架在跨语言转移方面取得了显著改进,尤其在低资源场景下,只需保留和微调极少量的参数。
大型语言模型的对齐方法依赖于人工标注数据,但随着模型发展,人类专业知识不足。研究发现辩论方法对非专家模型和人类都有帮助,准确率分别为76%和88%。无监督方式优化专业辩手的说服力可提高非专家模型在辩论中识别真相的能力。研究结果为通过辩论对齐模型提供了实证证据。
该研究综合研究了自监督学习技术在事件序列表示中的生成和对比方法,并提出了一种新的生成和对比嵌入对齐方法。实验证明该方法在各种任务上至少达到现有方法的水平,并在数据集上一直优于有监督方法。
本文研究了多任务学习的方法,使用共享特征表示所有任务,并研究了线性和ReLU激活模型的理论。实验证明任务数据的对齐有助于多任务训练和转移学习,对齐方法比BERT-LARGE在5个GLUE任务上平均提高了2.35%的得分,并设计了基于SVD的任务重新加权方案来提高多任务训练在多标签图像数据集上的鲁棒性。
本文提出了一种新的参数高效的跨语言转移学习框架,利用基于翻译的对齐方法来缓解多语言差异,并探索参数高效的微调方法。实验表明,该框架显著减少了语言之间的差异,在跨语言转移方面取得了改进,尤其在低资源场景中,同时只保留和微调极少量的参数。
完成下面两步后,将自动完成登录并继续当前操作。