小红花·文摘

位置编码中的插值及YaRN在更大上下文窗口中的应用

MachineLearningMastery.com ·

扩散模型的投影组合机制

Apple Machine Learning Research ·

本研究提出了一种新的seqKAN网络架构，旨在提高序列处理网络的解释性和可控性。该架构在复杂物理问题的插值和外推任务中表现优异，尤其在外推数据集上显著优于其他架构，具有更高的透明性。

seqKAN：使用科尔莫哥罗夫-阿诺德网络进行序列处理

BriefGPT - AI 论文速递 ·

本文探讨了学习支持外推的挑战，提出了一种新技术“时间上下文归一化”，显著提升了外推能力。研究表明，深度学习模型在处理不完整数据时具有更强的推广能力。提出的NeuralThink架构在对称和不对称任务中均优于传统方法。

插值、外推与超插值：向新维度推广

BriefGPT - AI 论文速递 ·

大型语言模型（LLMs）如GPT-3和LLaMA-2可以通过将时间序列编码为数字字符串来外推时间序列，性能与专用时间序列模型相当。LLMs能够自然地表示多模态分布，处理缺失数据，容纳文本边信息，并回答问题以帮助解释预测。增加模型大小通常会提高时间序列的性能，但GPT-4可能比GPT-3表现更差。

利用大规模语言模型增强时间序列分析：综述

BriefGPT - AI 论文速递 ·

大型语言模型（LLMs）如 GPT-3 和 LLaMA-2 可以通过编码时间序列为数字字符串来外推时间序列，性能与专用时间序列模型相当。LLMs 能够自然地表示多模态分布，处理缺失数据，容纳文本边信息，并回答问题以帮助解释预测。增加模型大小通常提高时间序列性能，但 GPT-4 可能比 GPT-3 表现更差。

论文：大型语言模型对时间序列分析的启示

BriefGPT - AI 论文速递 ·