小红花·文摘

本文提出了一种名为语言效能刺激（VES）的方法，通过鼓励性、挑衅性和批判性的语言提示，提升大型语言模型在零样本任务中的自我效能和表现。实验结果表明，这三种刺激方式能有效提高模型表现，不同模型对刺激的反应也存在差异，为后续研究提供了新视角。

Boosting Self-Efficacy and Performance of Large Language Models via Verbal Efficacy Stimulations

BriefGPT - AI 论文速递 ·

Meta AI 发布 MobileLLM 125M、350M、600M 和 1B 模型检查点

实时互动网 ·

Jurgen、曼宁等大佬新作：MoE重塑6年前的Universal Transformer，高效升级

机器之心 ·

本文探讨了视觉语言模型（VLMs）的性能提升，提出了多种方法改善图像与文本的对齐能力。通过创建ARO基准和CompPrompts数据集，研究了模型对语言信息的编码及其对组合推理的影响。实验表明，优化数据集质量和文本密度显著提高模型性能。此外，提出的加权视觉-文本交叉对齐方法在零样本任务中表现优异，效果与少样本学习相当。

ComAlign：视觉-语言模型中的组合对齐

BriefGPT - AI 论文速递 ·

本文介绍了多种基于CLIP模型的开放词汇语义分割方法，如VT-CLIP、CLIP-VIS和NACLIP。这些方法通过引入新模块和技术，显著提升了视频实例分割和语义分割的性能，尤其在零样本任务中表现突出，有效解决了领域偏差和特征对齐问题。

用于开放词汇分割的协同视觉 - 文本表示优化

BriefGPT - AI 论文速递 ·

本文提出了一种名为LSTPrompt的新方法，利用大型语言模型（LLMs）进行时间序列预测（TSF），在零样本任务中表现优异。研究总结了基于LLM的时间序列分析流程，探讨了未来研究机会，并提出了TEST方法，通过对时间序列进行编码和提示，提升LLMs的处理能力。实验证明，LLMs在时间序列分类和预测任务中表现出色，尤其在处理具有明确模式的数据时。

大型时间序列模型训练中不同设计选择的理解

BriefGPT - AI 论文速递 ·

本文评估了多模态大型语言模型的指导能力，并引入了I4基准测试。通过重新注入模块和无标注跨注意力引导的训练策略，实现了在复杂的视觉语言指令中有效处理的新型多模态大型语言模型Cheetah。该模型在I4中的零样本任务上表现出色，并与当前MME基准的最新指导优化模型相比具有竞争力的性能。

赋能视觉语言模型来遵循交替视觉语言指令

BriefGPT - AI 论文速递 ·