小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究探讨了宪法AI在小型模型(如LLaMA 3-8B)中的应用,发现其能有效提升模型的无害性,但有用性有所下降。同时,小型模型在自我改进方面面临挑战,出现崩溃迹象。

Constitution or Collapse? Exploring Constitutional AI and LLaMA 3-8B

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-07T00:00:00Z

本研究提出了一种无学习的方法(TSDI),有效解决了安全对齐方法在特定类别中的安全性问题。实验结果表明,该方法在提升模型可用性的同时,保持了安全性,改善了安全性与有用性之间的平衡。

通过去偏见实现安全对齐语言模型的脆弱性缓解

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-04T00:00:00Z

Aligner是一种新方法,通过学习对齐未对齐答案的校正残差,提高大型语言模型的对齐效率。它使用有监督学习训练seq2seq模型,避免了强化学习。Aligner显著提升了模型性能,例如对11种LLM的有用性提升18%,无害性提升23%。特别是对Llama2-70B的微调,有用性提高8.2%,无害性提高61.6%。

集成价值引导下的推理时语言模型对齐

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-26T00:00:00Z

本研究比较了医疗保健领域中三种生成式预训练转换模型的应用。结果显示,Drug-GPT 3和Drug-GPT 4模型提供了更有针对性和深入的见解,而ChatGPT模型生成了更宽泛和一般性的回答。评估医疗保健应用中生成信息的有用性时,需要考虑语言模型的观点、知识深度和时效性。

GPT、本体和 CAABAC:基于合规性、上下文和属性的三元个性化访问控制模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-13T00:00:00Z

本论文研究了语言模型对齐的重要性,并实验证实了对齐增加和模型有用性减少之间的权衡关系。同时,提出了对齐中表示工程的有用性边界。

机器语言模型中对齐和有用性之间的权衡

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-29T00:00:00Z

本文研究了解决知识图谱问答任务的知识图增强语言模型方法,实验证明该方法在回答准确性和知识陈述的有用性方面优于先前的方法。

大型语言模型的生物医学知识图增强提示生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-29T00:00:00Z
编码助手无法取代结对编程

Thoughtworks目前最广泛使用的编码辅助形式是IDE中的内联代码生成。对于这个问题的有用性,答案是有时候有用,有时候没用。使用编码辅助工具是一项需要时间积累的技能。

编码助手无法取代结对编程

Martin Fowler
Martin Fowler · 2023-08-10T13:31:00Z
探索生成式人工智能——中位数的三种版本

Thoughtworks目前最广泛使用的编码辅助形式是IDE中的内联代码生成。对于这种形式的有用性,意见不一,取决于具体情况和期望。有用性的定义是生成的建议能够帮助更快地解决问题,并且质量相当。影响建议有用性的因素包括技术栈、问题复杂度、建议大小、开发者经验和错误边界。使用编码辅助工具需要时间积累的技能,需要在安全环境中实验,建立对于何时使用工具和何时自己动手的感觉。

探索生成式人工智能——中位数的三种版本

Martin Fowler
Martin Fowler · 2023-07-27T14:34:00Z
探索生成式人工智能——工具链

Thoughtworks中最常用的编码辅助形式是IDE中的内联代码生成。对于这种辅助工具的有用性,意见不一。有用性取决于具体情况和期望。有用的定义是生成的建议能帮助更快解决问题,并且质量相当。影响有用性的因素有技术栈、问题复杂度、建议大小、开发者经验和错误边界。使用编码辅助工具需要技巧和时间来建立对于何时使用的感觉。

探索生成式人工智能——工具链

Martin Fowler
Martin Fowler · 2023-07-26T14:52:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码