小红花·文摘 - 小红花技术领袖俱乐部

该研究提出了一种名为HiTime的层次化多模态模型，旨在解决传统时间序列分类方法忽视动态时间信息和文本语义对齐的问题。通过双视角对比对齐模块和混合提示策略，该模型有效整合时间特征和文本语义，显著提升分类准确性。

Hierarchical Multimodal Large Language Models with Semantic Space Alignment for Enhanced Time Series Classification

BriefGPT - AI 论文速递 ·

本文介绍了一种层次化模型，能够从大规模文本库中推广教学知识，实现机器人对未见活动的零样本预测。研究涵盖多模态学习框架、视觉-文本匹配和神经符号学习等方法，展示了在视频动作预测任务中的有效性和高性能，尤其是在开放环境中的应用潜力。

ActionCOMET：一种零样本方法，学习图像特定的动作常识概念

BriefGPT - AI 论文速递 ·