多模态大语言模型(MLLMs)在时间序列推理方面进展有限。本文提出一种新颖的多模态时间序列LLM方法,利用轻量级编码器提取时间序列信息,并通过链式思维任务进行微调,以提升模型的推理能力。实验结果表明,该模型在零-shot推理任务中优于GPT-4o,并能有效学习时间序列特征。
我们提出了OpenOcc,一种将3D场景重建和开放词汇理解与神经辐射场结合的新型框架。通过占位表示法对场景的几何结构进行建模,并通过体素渲染将预训练的开放词汇模型蒸馏为3D语言场,以实现零-shot推理。实验证明,我们的方法在3D场景理解任务中取得了有竞争力的性能。
本研究提出了一种改进零-shot推理的方法,通过引入跨语言提示和跨语言自洽提示,在不同语言之间提高推理性能,并在多个基准测试中获得了最先进的结果。
完成下面两步后,将自动完成登录并继续当前操作。