小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究探讨了宪法AI在小型模型(如LLaMA 3-8B)中的应用,发现其能有效提升模型的无害性,但有用性有所下降。同时,小型模型在自我改进方面面临挑战,出现崩溃迹象。

Constitution or Collapse? Exploring Constitutional AI and LLaMA 3-8B

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-07T00:00:00Z

本研究提出了一种无学习的方法(TSDI),有效解决了安全对齐方法在特定类别中的安全性问题。实验结果表明,该方法在提升模型可用性的同时,保持了安全性,改善了安全性与有用性之间的平衡。

Mitigating Vulnerabilities in Safety-Aligned Language Models through Debiasing

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-04T00:00:00Z

本文介绍了一种名为Aligner的新方法,通过弱监督学习对大型语言模型进行高效对齐。Aligner在多个模型上显著提升了有用性和无害性,尤其在Llama2-70B上表现突出。研究探讨了弱到强的泛化现象及其潜在的欺骗问题,强调了对超级对齐的关注。通过自适应损失函数和细粒度监督,进一步提升了模型性能,展示了弱监督在大型语言模型微调中的重要性。

提升弱到强泛化性能的可靠性感知对齐

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-27T00:00:00Z

本文介绍了一种名为Aligner的新方法,通过有监督学习对大型语言模型(LLM)进行高效对齐,提升模型的有用性和无害性。Aligner在多个LLM上平均提高了18%的有用性和23%的无害性,尤其在Llama2-70B上表现显著。此外,研究探讨了利用合成数据和自定义奖励函数改善对齐目标的方法,并提出了“扩展-猜测-精化”的医学问答对齐策略,显著提升模型性能。

大型语言模型对齐的低冗余优化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-18T00:00:00Z

本论文研究了语言模型对齐的重要性,并实验证实了对齐增加和模型有用性减少之间的权衡关系。同时,提出了对齐中表示工程的有用性边界。

机器语言模型中对齐和有用性之间的权衡

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-29T00:00:00Z

本文研究了解决知识图谱问答任务的知识图增强语言模型方法,实验证明该方法在回答准确性和知识陈述的有用性方面优于先前的方法。

大型语言模型的生物医学知识图增强提示生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-29T00:00:00Z
编码助手无法取代结对编程

Thoughtworks目前最广泛使用的编码辅助形式是IDE中的内联代码生成。对于这个问题的有用性,答案是有时候有用,有时候没用。使用编码辅助工具是一项需要时间积累的技能。

编码助手无法取代结对编程

Martin Fowler
Martin Fowler · 2023-08-10T13:31:00Z
探索生成式人工智能——中位数的三种版本

Thoughtworks目前最广泛使用的编码辅助形式是IDE中的内联代码生成。对于这种形式的有用性,意见不一,取决于具体情况和期望。有用性的定义是生成的建议能够帮助更快地解决问题,并且质量相当。影响建议有用性的因素包括技术栈、问题复杂度、建议大小、开发者经验和错误边界。使用编码辅助工具需要时间积累的技能,需要在安全环境中实验,建立对于何时使用工具和何时自己动手的感觉。

探索生成式人工智能——中位数的三种版本

Martin Fowler
Martin Fowler · 2023-07-27T14:34:00Z
探索生成式人工智能——工具链

Thoughtworks中最常用的编码辅助形式是IDE中的内联代码生成。对于这种辅助工具的有用性,意见不一。有用性取决于具体情况和期望。有用的定义是生成的建议能帮助更快解决问题,并且质量相当。影响有用性的因素有技术栈、问题复杂度、建议大小、开发者经验和错误边界。使用编码辅助工具需要技巧和时间来建立对于何时使用的感觉。

探索生成式人工智能——工具链

Martin Fowler
Martin Fowler · 2023-07-26T14:52:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码