小红花·文摘

本研究提出了两种策略来减轻大型视觉-语言模型（LVLMs）中的偏见，并实验证明这些策略有效减轻偏见，生成更有用和准确的插图。

Dysca: LVLMs 感知能力评估的动态可扩展基准

BriefGPT - AI 论文速递 ·

通过研究评估作品，发现两个问题：1）视觉内容对于很多样本来说是不必要的；答案可以从问题和选项中推断出来，或者来自于LLM中的世界知识。2）在LLM和LVLM训练中存在数据泄漏。为解决这些问题，提出了MMStar，一个具有6个核心能力和18个详细方向的多模态基准。在MMStar上评估了16个主要的LVLM，并调查了它们的数据泄漏和实际多模态增益。

INS-MMBench: 保险领域 LVLMs 性能综合评估的全面基准

BriefGPT - AI 论文速递 ·

GPT-4V在情感分析、仇恨言论检测、假新闻识别、人口推断和政治意识形态检测等任务上表现出显著效果，具备联合理解、文化和语境意识、广泛的常识知识。然而，它在多语言社交媒体理解和对最新趋势的泛化方面仍有挑战，并且存在错误信息生成的倾向。研究结果显示，大型多模态模型在理解社交媒体内容和用户方面具有巨大潜力。

FakeNewsGPT4：通过知识增强的 LVLMs 推进多模态假新闻检测

BriefGPT - AI 论文速递 ·

通过RLHF方法对大规模语言模型进行微调，使其更好地与用户偏好相匹配。提出了Diffusion-DPO方法，通过在人类比较数据上进行直接优化，使扩散模型与人类偏好相匹配。使用Diffusion-DPO对稳定扩散XL-1.0模型进行微调，提高了视觉吸引力和提示对齐。开发了一个使用AI反馈的变体，为扩展扩散模型对齐方法打开了大门。

超越幻觉：通过幻觉感知的直接偏好优化增强 LVLMs

BriefGPT - AI 论文速递 ·

本文研究了大规模视觉-语言模型的集成方法，通过选择具有高度互补性的多种模型来解决任务，实验结果表明集成模型的准确率潜在提升很大。

如何（不）为 VQA 集成 LVLMs

BriefGPT - AI 论文速递 ·