小红花·文摘

首个评估MLLMs对地质图理解的基准集，以及专为地质图理解设计的Agent

机器之心 ·

大型语言模型（LLMs）和多模态大型语言模型（MLLMs）的快速发展暴露了各种对抗性攻击的漏洞。本文综述了针对 LLMs 和 MLLMs 的越狱研究的最新进展，重点介绍了评估基准、攻击技术和防御策略。与单模态越狱的更先进状态相比，多模态领域仍未得到充分开发。我们总结了多模态越狱的限制和潜在研究方向，旨在激发未来研究，进一步增强 MLLMs 的鲁棒性和安全性。

从 LLMs 到 MLLMs：探索多模态越狱的领域

BriefGPT - AI 论文速递 ·

hyper.ai官网更新了优质公共数据集和教程精选，包括ChartQA、RS5M、CapsFusion-120M、ShareGPT4V、RLAIF-V-Dataset、FoodLogoDet-1500、ZSFooD、Food-1K、ISIA Ingredient-201和ISIA Food-500。教程精选包括ComfyUI DynamiCrafter教程和GLM-4-9B-Chat Demo。此外，还有社区文章精选和热门百科词条。

倒计时 3 天！立即预约苹果 WWDC24 直播；RLAIF-V 大规模多模态偏好数据集上线，有效减少不同 MLLMs 幻觉现象

HyperAI超神经 ·

该研究引入MileBench基准评估多模态大型语言模型（MLLMs）在长上下文和多图像任务中的表现，发现开源MLLMs在这些情境中存在挑战。提出的MemWalker方法通过摘要节点树处理长上下文，提升了问答性能和可解释性。研究强调了长上下文理解的重要性，并指出现有模型在处理长上下文时存在显著差距。

从文本到像素：MLLMs 中的长篇背景理解的进展

BriefGPT - AI 论文速递 ·

研究表明，大型语言模型在逻辑推理方面存在缺陷，导致生成反事实答案。为增强其逻辑推理能力，提出了多种策略并通过综合数据集进行评估。研究发现，众包工作者更偏好基于知识的解释，需提高模型生成解释的简明性和新颖性。此外，提出了多阶段框架以提升模型在药物相关查询中的响应质量，并通过反复辩论改善语言响应表现，尤其是在数学和策略推理方面。

使用忠实、简洁和可传递的原理教授 MLLMs

BriefGPT - AI 论文速递 ·

我们介绍了 Draw-and-Understand 项目，其中包括一种新的多模域数据集和一种具有挑战性的视觉提示基准测试。我们提出了 SPHINX-V，一种新的端到端训练的多模域大型语言模型，用于连接视觉编码器、视觉提示编码器和语言理解模型，以实现各种视觉提示和语言理解。同时，我们还提出了 MDVP-Data 和...

绘制与理解：利用视觉提示使 MLLMs 能够理解您想要的内容

BriefGPT - AI 论文速递 ·

本文介绍了一种针对大型视觉语言模型的训练策略MoE-tuning，通过构建一个具有巨大数量参数但恒定计算成本的稀疏模型，有效解决多模态学习和模型稀疏性带来的性能退化问题。实验证明，MoE-LLaVA在视觉理解方面具有出色的能力，并且在模型输出的对象幻象基准测试中超越了LLaVA-1.5-13B，在各种视觉理解数据集上表现可与LLaVA-1.5-7B相媲美。通过MoE-LLaVA，我们旨在为稀疏LVLMs建立基准，并为未来开发更高效和有效的多模态学习系统提供有价值的见解。

LLaVA-MoLE：稀疏的 LoRA 专家混合模型用于缓解指令微调 MLLMs 中的数据冲突

BriefGPT - AI 论文速递 ·

通过对专有和开源多模态大语言模型的定性研究，本文旨在增强对最近的 MLLM 在一般化、可信度和因果推理能力方面与广大公众期望之间差距的理解，主要关注文本、代码、图像和视频四个模态，最终目标是提高 MLLM 透明度，发现 14 个实证性发现以深入了解专有和开源 MLLM 的能力和限制，以实现更可靠的多模态下游应用。

从 GPT-4 到 Gemini 和更远：通过四种方式评估 MLLMs 的一般化能力、可靠性和因果关系

BriefGPT - AI 论文速递 ·

该论文介绍了AGREE框架，用于改善大型语言模型在真实世界中的应用。该框架通过考虑生成的支持信息和提供引用来调整模型对检索文档中主张的立足，解决了生成的“幻觉”答案不符事实的问题。实验结果表明，基于调整的AGREE框架相较于基于提示的方法，生成了更好的基于立足的回答和更准确的引用。

提升文档理解能力的研究：基于 MLLMs 的文本定位探索

BriefGPT - AI 论文速递 ·

本调查全面概述了大型语言模型（LLM）幻像领域的最新进展，包括幻像创新分类、成因、检测方法、基准以及减轻策略，并分析了当前挑战和未来研究方向。

一种适用于 MLLMs 幻觉评估的无 LLM 多维基准

BriefGPT - AI 论文速递 ·