BriefGPT - AI 论文速递 ·

滤波而非混合：基于随机滤波的大语言模型混合的在线门控

📝

内容提要

提出了 MoE-F 机制，用于在在线时间序列预测任务中结合 N 个预训练的大型语言模型 (LLMs)，通过自适应性地预测在每个时间步骤中 LLMs 预测的最佳加权。通过利用每个专家的运行表现中的条件信息，我们的机制可以预测最佳的 LLMs 组合以预测时间序列的下一个步骤。通过将专家选择问题构建为有限状态空间、连续时间的隐马尔可夫模型 (HMM)，我们可以利用 Wohman-Shiryaev...

🏷️

滤波而非混合：基于随机滤波的大语言模型混合的在线门控

内容提要

标签

继续阅读