小红花·文摘

本研究提出了新基准ModelingBench，以解决现有基准无法反映真实世界问题复杂性的问题。创新的多代理框架ModelingAgent能够协调工具使用，支持自我完善，生成高质量解决方案。实验证明其优于传统方法，推动现实问题解决的评估与进展。

BriefGPT - AI 论文速递 ·

DEV Community ·

本研究提出了一种知识驱动的多代理框架m-KAILIN，旨在解决生物医学领域开放式注释科学语料数量和质量不足的问题。该框架通过合作多代理架构提取和合成高质量文本数据，显著提升生物医学问答任务的表现，生成的数据集在一定程度上超越了现有模型。

BriefGPT - AI 论文速递 ·

本研究提出了SchemaAgent，一个多代理框架，用于自动化关系数据库模式设计。该框架利用大型语言模型，通过角色协作优化子任务执行，从而提升数据库模式生成的质量。实验结果表明，SchemaAgent在模式生成方面优于主流模型。

BriefGPT - AI 论文速递 ·

本研究提出了DeepFund平台，旨在评估大型语言模型（LLMs）在基金投资中的有效性。该平台采用多代理框架和前向测试方法，模拟真实市场环境，消除信息泄露问题，从而为LLMs在金融市场的应用提供更准确的评估。

BriefGPT - AI 论文速递 ·

DEV Community ·

本研究提出了ViDoRAG，一个新型多代理框架，旨在提高传统检索增强生成方法在处理视觉文档时的效率和推理能力。该方法通过混合策略和迭代代理工作流，显著提升了复杂推理能力，并在ViDoSeek基准测试中超越现有方法超过10%。

BriefGPT - AI 论文速递 ·

本研究提出了名为Seeker的多代理框架，旨在提升软件开发中的异常处理效率。研究表明，普通开发者在异常处理上存在困难，而Seeker通过模仿专家策略，显著增强了代码的鲁棒性和可靠性。

BriefGPT - AI 论文速递 ·

RECONCILE是一个多代理框架，能够让不同的大型语言模型进行多轮讨论，达成共识并解决复杂的推理任务。它包括三个主要阶段：生成初始响应、多轮讨论和生成最终答案。最终答案通过置信度加权投票产生。这种方法提高了推理能力。

极道 ·