滤波而非混合:基于随机滤波的大语言模型混合的在线门控

📝

内容提要

提出了 MoE-F 机制,用于在在线时间序列预测任务中结合 N 个预训练的大型语言模型 (LLMs),通过自适应性地预测在每个时间步骤中 LLMs 预测的最佳加权。通过利用每个专家的运行表现中的条件信息,我们的机制可以预测最佳的 LLMs 组合以预测时间序列的下一个步骤。通过将专家选择问题构建为有限状态空间、连续时间的隐马尔可夫模型 (HMM),我们可以利用 Wohman-Shiryaev...

🏷️

标签

➡️

继续阅读