小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了两种策略来减轻大型视觉-语言模型(LVLMs)中的偏见,并实验证明这些策略有效减轻偏见,生成更有用和准确的插图。

Dysca: LVLMs 感知能力评估的动态可扩展基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-27T00:00:00Z

通过研究评估作品,发现两个问题:1)视觉内容对于很多样本来说是不必要的;答案可以从问题和选项中推断出来,或者来自于LLM中的世界知识。2)在LLM和LVLM训练中存在数据泄漏。为解决这些问题,提出了MMStar,一个具有6个核心能力和18个详细方向的多模态基准。在MMStar上评估了16个主要的LVLM,并调查了它们的数据泄漏和实际多模态增益。

INS-MMBench: 保险领域 LVLMs 性能综合评估的全面基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-13T00:00:00Z

GPT-4V在情感分析、仇恨言论检测、假新闻识别、人口推断和政治意识形态检测等任务上表现出显著效果,具备联合理解、文化和语境意识、广泛的常识知识。然而,它在多语言社交媒体理解和对最新趋势的泛化方面仍有挑战,并且存在错误信息生成的倾向。研究结果显示,大型多模态模型在理解社交媒体内容和用户方面具有巨大潜力。

FakeNewsGPT4:通过知识增强的 LVLMs 推进多模态假新闻检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-04T00:00:00Z

通过RLHF方法对大规模语言模型进行微调,使其更好地与用户偏好相匹配。提出了Diffusion-DPO方法,通过在人类比较数据上进行直接优化,使扩散模型与人类偏好相匹配。使用Diffusion-DPO对稳定扩散XL-1.0模型进行微调,提高了视觉吸引力和提示对齐。开发了一个使用AI反馈的变体,为扩展扩散模型对齐方法打开了大门。

超越幻觉:通过幻觉感知的直接偏好优化增强 LVLMs

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-28T00:00:00Z

本文研究了大规模视觉-语言模型的集成方法,通过选择具有高度互补性的多种模型来解决任务,实验结果表明集成模型的准确率潜在提升很大。

如何(不)为 VQA 集成 LVLMs

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-10T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码