小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了LLMSelector框架,旨在优化复合人工智能系统中的模型选择问题。实验证明,该方法在多代理辩论和自我提升等任务中,准确性提升了5%-70%。

Optimizing Model Selection for Compound AI Systems

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-20T00:00:00Z

本文研究了多代理辩论和嵌入式聚类对现代语言模型在对抗性攻击中的影响,发现多代理辩论能够降低模型的有害性并增强其抵抗力。通过多个语言模型的辩论,改善了数学和策略推理的表现,解决了虚假答案和幻觉现象。此外,研究提出了基于去中心化的计算任务分配和智能合约奖励技术,以优化多智能体之间的通信和决策能力。

优化稀疏通信拓扑的多智体辩论

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-17T00:00:00Z

本文提出了一种基于马尔可夫链的多代理辩论验证框架,旨在提高语言模型中幻觉的检测准确性。研究构建了新的幻觉基准,设计了有效的检测方法,系统分析了幻觉的来源及缓解策略,显著提升了检测性能,为理解和解决语言模型中的幻觉问题提供了重要发现。

LLM 幻觉检测的概率框架:基于信念树传播

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-11T00:00:00Z

本文探讨了基于大型语言模型的自然语言生成(NLG)评估方法,提出了多代理辩论框架和自动化评判系统,以提高评估的可靠性和效率。研究表明,辩论方法能有效提升模型的准确性,并为未来研究提供新思路。

辩论:基于魔鬼辩护的评估与文本评价

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-16T00:00:00Z

本文探讨了大型语言模型(LLMs)在对抗性攻击下的安全性,提出了DRA黑盒越狱方法,成功率高达90%。研究评估了多种攻击与防御技术,并引入环境背景的对抗性游戏(ICAG)以增强防御能力。通过多代理辩论,发现可有效减少模型的有害性,提升抵抗能力。

学会伪装:通过多智能体攻击者 - 伪装者游戏避免 LLM 的拒绝回应

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-03T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码