我们正在构建混合模型(MoM)系统,以提升大型语言模型(LLM)的集体智能。核心问题包括捕捉请求与响应信号、优化模型协作和确保系统安全。通过vLLM语义路由器,我们展示了在AMD GPU上实时路由查询的能力,支持多种模型和信号类型。MoM架构通过智能调度和能力匹配,实现高效的AI部署。
哈工大和鹏城实验室的研究人员提出了DeePEn框架,实现了Training-free的异构大模型集成学习,通过融合多个模型输出的概率分布,实现更深层次的模型协作。实验结果表明,DeePEn在多个公开数据集上取得了显著提升,有效扩展大模型性能边界。
完成下面两步后,将自动完成登录并继续当前操作。