小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
大型语言模型是否有英语口音?评估和改善多语言大型语言模型的自然性

当前大型语言模型主要以英语为主,导致多语言输出不自然。本文提出新的自动化语料库评估指标,评估多语言环境下LLM输出的自然性,并在法语和中文中进行测试,发现英语影响的模式。为改善这一问题,提出了一种简单有效的对齐方法,提升目标语言的自然性,同时不影响通用基准的表现。

大型语言模型是否有英语口音?评估和改善多语言大型语言模型的自然性

Apple Machine Learning Research
Apple Machine Learning Research · 2025-05-16T00:00:00Z

本研究探讨了大型语言模型(LLMs)与人类价值观的一致性,指出现有对齐方法仅提供局部安全,仍存在有害知识。通过分析验证,模型在对抗性诱导下表现出脆弱性,攻击成功率可达100%。

揭示对齐的大型语言模型的内在伦理脆弱性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-07T00:00:00Z

本研究探讨了人工通用智能(AGI)安全开发中,依赖共识的对齐方法无法识别新解决方案的问题。提出的功能性认识闭合模型揭示了认知、制度和社会过滤器如何影响对齐提案的理解,缺乏递归模型可能导致不可逆的失调风险,影响AGI的安全开发。

Epistemic Closure and the Irreversibility of Misalignment: Modeling Systemic Barriers to Alignment Innovation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-02T00:00:00Z

本研究提出了 extsc{AlignX}数据集及两种对齐方法,解决了大型语言模型在用户偏好对齐中的单一标准化问题,实验结果显示准确率提高了17.06%。

From One Million Users to Each User: Expanding Personalized Preferences for User-Level Alignment

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-19T00:00:00Z

本书探讨大型语言模型的基本概念,分析预训练、生成模型、提示技术和对齐方法,旨在帮助自然语言处理领域的学生和从业者理解这一快速发展的领域。

大型语言模型的基础

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-16T00:00:00Z

本研究提出了一种新颖的对齐方法——逐步扩散策略优化(SDPO),有效解决了现有对齐方法在少步扩散模型中的泛化不足问题。实验结果表明,SDPO在奖励基础对齐方面优于以往方法,展现出强大的泛化能力。

Aligning Few-Step Diffusion Models with Dense Reward Difference Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-18T00:00:00Z

本文探讨了大型语言模型(LLM)的对齐方法,提出了URIAL、Aligner和LongAlign等新技术,显著提升了微调和长篇背景处理的性能。研究强调了对齐分析的重要性,并提出了经济高效的对齐替代方案PreTTY,推动多语言LLM的发展。此外,选择性调优关键层可提高微调效率。

L3Ms -- 拉格朗日大语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-28T00:00:00Z

本文介绍了一系列支持高达32,768个令牌的长上下文大型语言模型(LLMs),通过持续预训练和长文本数据集,这些模型在长上下文任务上相较于Llama 2有显著提升。研究分析了对齐方法和长上下文能力的增强技术,提出了LongAlign框架和GATEAU框架,显著提高了模型在长篇背景任务中的性能。

LOGO - 通过高效偏好优化实现长上下文对齐

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-24T00:00:00Z

本研究提出了GenARM,一种基于自回归奖励模型的高效对齐方法,旨在解决大型语言模型与人类偏好对齐的成本和效率问题。实验证明,GenARM在性能上显著优于传统方法,并支持多目标对齐,以满足用户的多样化需求。

GenARM: Reward-Guided Autoregressive Reward Model Generation for Test-Time Alignment

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-10T00:00:00Z

本文探讨了大型语言模型(LLMs)与人类偏好的对齐方法,包括点对点偏好学习、奖励模型优化和软偏好优化。研究表明,利用奇异值分解和联合指导-回应偏好数据等技术,可以显著提升模型的对齐效果,增强与人类偏好的匹配。

朝着大型语言模型偏好学习的统一视角:一项调查

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-04T00:00:00Z

本文探讨了大型语言模型(LLMs)与人类偏好的对齐方法,提出了基于贝叶斯推理的d-PM模型和主动选择提示的APO算法,以提高偏好数据的收集效率和质量。这些方法旨在克服传统强化学习的局限性,确保生成的响应更符合人类偏好,从而提升模型的安全性和实用性。

基于偏好引导的反射采样以调整语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-22T00:00:00Z

本文研究了大型语言模型中的遗忘机制,提出三种对齐方法以删除有害回应、版权内容和幻觉。通过引入轻量级的取消学习层,框架有效更新模型,解决用户隐私问题。研究表明,结合梯度上升与下降的方法能提升模型性能,推动道德AI实践的发展。

面向大型语言模型的鲁棒且成本高效的知识遗忘

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-13T00:00:00Z

本研究探讨了对齐方法在不同情境下的表现,发现小规模训练数据在数学问题解决中效果最佳。提出了长期记忆对话(LeMon)任务,并构建了具长期记忆机制的对话生成框架PLATO-LTM,显著提升了对话一致性。此外,研究了基于大型语言模型的对话状态跟踪和记忆管理,提出了逐步DPO方法,提升了模型性能。

基于 sLLM 的高效准确可记忆对话模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-09T00:00:00Z

本文研究了大型语言模型(LLM)的对齐方法,分析了对齐数据集和技术对模型性能的影响。研究表明,较小训练数据子集中的对齐方法在数学问题解决中效果最佳。提出了一种基于蒸馏的多模态对齐模型,增强了语言能力,并通过细粒度监督提升了模型性能。此外,提出了一种参数高效的对齐方法(MEET),显著提高了可控生成质量,强调了对人类偏好的对齐对模型安全性的重要性。

LIONs:一种经验优化的语言模型对齐方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-09T00:00:00Z

本文提出了一种新的参数高效的跨语言转移学习框架,通过基于翻译的对齐方法来减少多语言差异,并采用微调方法来提高效率。实验证明,该框架在跨语言转移方面取得了显著改进,尤其在低资源场景下,只需保留和微调极少量的参数。

面向视觉 - 语言模型的跨模态向后兼容表示学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-23T00:00:00Z

大型语言模型的对齐方法依赖于人工标注数据,但随着模型发展,人类专业知识不足。研究发现辩论方法对非专家模型和人类都有帮助,准确率分别为76%和88%。无监督方式优化专业辩手的说服力可提高非专家模型在辩论中识别真相的能力。研究结果为通过辩论对齐模型提供了实证证据。

辩论:基于魔鬼辩护的评估与文本评价

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-16T00:00:00Z

大型语言模型的对齐方法依赖于人工标注数据,但随着模型发展,人类专业知识不足。研究发现辩论方法对非专家模型和人类都有帮助,准确率分别为76%和88%。无监督方式优化专业辩手的说服力可提高非专家模型在辩论中识别真相的能力。研究结果为通过辩论对齐模型提供了实证证据。

将专家和非专家的观点结合起来,利用 LLMs 评估在线讨论中的审议质量

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-03T00:00:00Z

该研究综合研究了自监督学习技术在事件序列表示中的生成和对比方法,并提出了一种新的生成和对比嵌入对齐方法。实验证明该方法在各种任务上至少达到现有方法的水平,并在数据集上一直优于有监督方法。

事件序列的自我监督学习:生成建模和对比学习的比较研究与混合方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-29T00:00:00Z

本文研究了多任务学习的方法,使用共享特征表示所有任务,并研究了线性和ReLU激活模型的理论。实验证明任务数据的对齐有助于多任务训练和转移学习,对齐方法比BERT-LARGE在5个GLUE任务上平均提高了2.35%的得分,并设计了基于SVD的任务重新加权方案来提高多任务训练在多标签图像数据集上的鲁棒性。

多单元软传感实现少样本学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-27T00:00:00Z

本文提出了一种新的参数高效的跨语言转移学习框架,利用基于翻译的对齐方法来缓解多语言差异,并探索参数高效的微调方法。实验表明,该框架显著减少了语言之间的差异,在跨语言转移方面取得了改进,尤其在低资源场景中,同时只保留和微调极少量的参数。

在跨语言迁移范式中衡量灾难性遗忘:探索调整策略

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-12T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码