标签

 多智能体 

相关的文章:

通过多智能体攻击者 - 伪装者游戏避免 LLM 的拒绝回应,CMAT:增强小型语言模型的多智能体协作优化框架,多智能体强化学习中的化学趋化策略的出现,GOV-REK:设计鲁棒多智能体强化学习系统的受管理奖励构筑核心,MineLand: 模拟大规模多智能体交互,具有有限的多模态感知和生理需求。

BriefGPT - AI 论文速递

BriefGPT - AI 论文速递 -

最优和有界次优的任意角度多智能体路径规划

多智能体路径规划中的任意角路径规划问题,利用连续冲突搜索算法和安全区间路径规划算法的最优算法及其可行解空间分割和多约束技术,能解决比传统组合更多的问题。

本文研究了多个代理节点在2D空间中寻找无冲突路径的问题,并使用分离式的优先级方法解决。研究者提出了基于SIPP算法的新型路径规划器,用于在网格上寻找代理节点在动态障碍物之间移动的轨迹。在模拟测试中,该规划器相比基本移动规划器能够找到更好的解决方案。

相关推荐 去reddit讨论
BriefGPT - AI 论文速递

BriefGPT - AI 论文速递 -

多智能体轨迹预测的神经交互能量

通过神经交互能量的多智能体轨迹预测框架 MATE,我们引入了两个约束条件以增强时间稳定性,即智能体间的相互作用约束和智能体内部运动约束,有效地减轻了多智能体系统中固有的预测波动。对比四个不同数据集上以前的方法的评估结果突出了我们模型的优越预测准确性和泛化能力。

该研究提出了一种基于神经网络和博弈理论的可训练架构,用于预测代理的轨迹。实验评估表明,该方法在驾驶员合并轨迹和决策制定任务上表现良好。

相关推荐 去reddit讨论
BriefGPT - AI 论文速递

BriefGPT - AI 论文速递 -

能源网络的多智能体强化学习:计算挑战、进展与开放问题

电网架构和功能的快速变化以及可再生能源和分布式能源资源的不断增长导致了各种技术和管理挑战。本调研报告探讨了多智能体强化学习(MARL)如何支持能源网络的去中心化和脱碳,并缓解相关的挑战。通过指定管理能源网络中的关键计算挑战,回顾最新的研究进展,以及突显可以使用 MARL 解决的开放性挑战。

本报告探讨了电网架构和功能的变化,以及可再生能源和分布式能源资源的增长对技术和管理带来的挑战。通过多智能体强化学习,支持能源网络的去中心化和脱碳,并解决相关挑战。回顾最新研究进展,突显强化学习解决的开放性挑战。

相关推荐 去reddit讨论
BriefGPT - AI 论文速递

BriefGPT - AI 论文速递 -

CT-Agent: 临床试验多智能体基于大语言模型的推理

一个整合了 GPT-4、多智能体架构、从最少到最多过滤排序和反应推理技术的临床多智能体系统(CT-Agent),在临床试验任务中提高了大语言模型的性能,并引入了新的功能。

我们提出了一种TrainerAgent系统,通过分析、规划和决策能力,以及四个代理的协作,优化用户定义的任务、输入数据和需求,获得满足要求的模型,并将其作为在线服务部署。该系统在效率和质量方面取得了显著进展。

相关推荐 去reddit讨论
BriefGPT - AI 论文速递

BriefGPT - AI 论文速递 -

无线认知网络中的多智能体混合 SAC 算法实现联合 SS-DSA

通过利用混合软行为者评论家算法的多智能体强化学习方法,实现了动态频谱访问中联合频谱感知和资源分配的优化,以最大化网络的通信速率,并在实验中验证了该算法在增加频谱资源利用率、限制对主网络干扰方面优于现有技术。

本研究提出了一种新的解决无线频谱多接入问题的方法,通过资源分配决策来优化公平度和用户数据相关性。实验结果显示该方法在各种情况下都优于其他方法,为未来联邦动态应用提供了有希望的候选方案。

相关推荐 去reddit讨论
BriefGPT - AI 论文速递

BriefGPT - AI 论文速递 -

基于多智能体强化学习的分布式黑盒模型逆推攻击

基于生成对抗网络的模型逆向攻击旨在通过在潜在空间中搜索代码来从复杂深度学习模型中恢复私有训练数据。本文提出了一种新颖的分布式黑盒模型逆向攻击方法,通过构建概率潜在空间来搜索目标隐私数据,相比现有方案具有更好的攻击准确性和性能。

本文介绍了一种名为CG-MI的置信度引导模型反演攻击方法,利用预训练的GAN的潜在空间和无梯度优化器,在不同数据分布的黑盒设置中实现了高分辨率的模型反演攻击。该方法在Celeba和Facescrub的不同分布设置中,比SOTA黑盒MIA的攻击效果提高了超过49%和58%。此外,该方法能够生成与白盒攻击产生的高质量图像相当的图像。该方法为黑盒模型反演攻击提供了实用而有效的解决方案。

相关推荐 去reddit讨论
BriefGPT - AI 论文速递

BriefGPT - AI 论文速递 -

多智能体强化学习的群体感知协调图

我们提出了一种新的方法来推断组感知协作图(GACG),以捕捉基于当前观测到的代理之间的合作以及跨轨迹观察到的行为模式的组水平依赖关系,并在决策过程中使用该图进行信息交换。通过在 StarCraft II 微管理任务上进行评估,我们证明了 GACG 的卓越性能。进一步的消融研究为我们的方法的每个组成部分的有效性提供了实验证据。

我们提出了一种新的方法来推断组感知协作图(GACG),以捕捉基于当前观测到的代理之间的合作以及跨轨迹观察到的行为模式的组水平依赖关系,并在决策过程中使用该图进行信息交换。通过在 StarCraft II 微管理任务上进行评估,我们证明了 GACG 的卓越性能。进一步的消融研究为我们的方法的每个组成部分的有效性提供了实验证据。

相关推荐 去reddit讨论
BriefGPT - AI 论文速递

BriefGPT - AI 论文速递 -

基于核的学习在多智能体应用中的保证

本文讨论了网络中观察到噪声环境下潜在多维非线性现象的基于核的学习问题,提出了一种学习算法,仅需要关于研究对象的轻微先验知识,并提供了相应的非渐近高概率误差界限的模型。本文还提供了方法的非渐近分析和数值模拟结果。

在网络建模多智能体系统是一个挑战。研究者提出了基于ALS算法和ORALS算法的解决方法。这两种算法适用于大量数据轨迹,且保证可识别性和适定性。ORALS算法在欠定条件下是一致且渐近正常的。实验结果表明这些方法在不同模型上都有效。

相关推荐 去reddit讨论
BriefGPT - AI 论文速递

BriefGPT - AI 论文速递 -

LLMs 的置信度校准和理性化通过多智能体思考

当前大型语言模型中的不确定性估计问题是一个重要的问题,这些模型通常不够校准,且过于自信,特别在从人类反馈中进行强化学习时。与人类不同,人类的决策和自信度不仅源于内在信念,还可以通过日常观察进行调整,而现有的语言模型校准方法主要集中在估计或引导个体自信度,而未充分利用 “集体智慧”:多个语言模型之间的互动能够共同提高准确性和校准度。在本研究中,我们提出了协同校准(Collaborative Calibration),这是一种无需后期训练的校准策略,利用了多个增强型语言模型代理在模拟团体讨论过程中的协同和表现能力。我们在不同领域的生成型问答任务中展示了协同校准的有效性,展示了其利用共同校准的自信度评估进行合理化,并提高模型预测可靠性的潜力。

本研究提出了协同校准策略,利用多个增强型语言模型代理的协同和表现能力,提高模型预测可靠性。在生成型问答任务中展示了协同校准的有效性。

相关推荐 去reddit讨论
BriefGPT - AI 论文速递

BriefGPT - AI 论文速递 -

360°REA:面向多智能体系统的可重用经验积累与 360° 评估

大型语言模型代理在各种复杂任务中展示出了显著的进展。最近的研究集中在优化代理团队或使用自我反思来迭代解决复杂任务。本文提出了一种灵感来自公司组织实践的层次化多代理框架,360° 可重复利用经验积累评估(360°REA)。该框架使用一种新颖的 360 度绩效评估方法,进行多角度的绩效评估和细粒度的评估。为了增强代理在处理复杂任务时的能力,我们引入了双层经验池,使代理可以通过细粒度评估来积累经验。对复杂任务数据集的大量实验证明了 360°REA 的有效性。

大型语言模型代理在复杂任务中取得进展。本文提出了一种多代理框架,使用360°绩效评估方法,增强代理处理复杂任务的能力。实验证明该框架有效。

相关推荐 去reddit讨论

热榜 Top10

观测云
观测云
Dify.AI
Dify.AI
eolink
eolink
LigaAI
LigaAI

推荐或自荐