本研究提出了一种新方法——视觉指令瓶颈调优(Vittle),旨在解决多模态大型语言模型(MLLMs)在分布转移时的性能下降问题。Vittle通过信息瓶颈原理,显著提升了模型在开放式与封闭式问答及物体幻觉检测任务中的鲁棒性。
本研究提出了一种信息瓶颈语言模型(IBLM),通过压缩内部表征来提升模型的泛化能力。引入了门控相变(GAPT)算法,实现了记忆与压缩的自适应切换,实验结果表明GAPT显著提升了模型性能。
本文研究视频分类的可解释性,提出了一种名为VIBA的方法,旨在解决视频序列中的信息瓶颈问题。该方法应用于深度伪造检测,展示了其生成一致解释的能力,接近人工注释,为视频分类和检测提供了解释性支持。
本研究提出了一种新方法,结合信息瓶颈和基于原型的方法,以提升时间图回归模型的可解释性。通过引入GINTRIP框架,模型在实际交通数据集上表现出色,具有重要的应用潜力。
IBKD是一种基于信息瓶颈的知识蒸馏方法,通过最大化教师模型和学生模型的互信息,减少学生模型和输入数据的互信息,以应用于文本表示和下游任务。
该文章介绍了一种新的持续文本分类方法 InfoCL,通过快慢对比学习和当前-过去对比学习来进行互信息最大化,有效地减轻了遗忘问题,并在三个文本分类任务上达到了最先进的性能。
本文提出了一种基于信息瓶颈的无监督方法,用于探索稀疏的多智能体增强学习中的社交通信情境。该方法可以捕捉复杂性和任务特定效用,并开发出一种自然语言灵感的信息组成的词汇表,通过社交影子来学习通信策略。
完成下面两步后,将自动完成登录并继续当前操作。