小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本文介绍了图像生成技术的发展,重点讨论了CLIP和BLIP及其变体的结构与训练方法。CLIP通过对比学习实现图像与文本的匹配,BLIP结合理解与生成能力,提升多模态任务表现。BLIP2引入Q-Former模块,优化视觉与语言对齐,InstructBLIP增强指令遵循能力,适应不同任务需求。

图文对比学习的发展史:从CLIP、BLIP、BLIP2、InstructBLIP到具身模型常用的SigLIP

结构之法 算法之道
结构之法 算法之道 · 2025-08-22T15:13:18Z

本研究探讨了如何区分模型在微调与预训练中获得的知识。通过混合马尔可夫逻辑网络建立的概率模型显示,BLIP2在微调时对知识的影响较小,表明其具备强大的通用知识获取能力。这为理解多模态系统提供了新思路。

Decoupling Fine-tuning and Pre-training in Visual Captioning under Hybrid Markov Logic

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-18T00:00:00Z

基于BLIP-2框架,开发了一种视觉语言模型,将病理报告文本与切片图像配对,形成图像-文本嵌入空间。该模型在超过35万张去标识化数据上评估,78%的生成文本被病理医师认为准确,展示了语言与WSI嵌入结合的潜力。

用于临床病理分析的大型视觉语言模型中的高效全面特征提取

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

基于BLIP-2框架,开发了一种视觉语言模型,将病理报告文本与切片图像配对,形成图像-文本嵌入空间。该模型在超过35万张去标识化数据上评估,78%的生成文本被病理医师认为准确,展示了语言与WSI嵌入结合的潜力。

将知识概念与全切片图像对齐以实现精确的组织病理图像分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-27T00:00:00Z

本文介绍了多模态模型的基本思想、结构和训练数据集情况,并详细介绍了CLIP、BLIP和BLIP2等经典多模态模型。同时,介绍了飞桨多模态框架PaddleMIX和其在VQA和Caption任务中的应用。

一站式解读多模态——Transformer、Embedding、主流模型与通用任务实战(下)

百度大脑
百度大脑 · 2024-04-08T10:54:56Z

该文介绍了使用CLIP和BLIP-2模型对DataComp挑战赛中的网络爬行数据进行过滤和修改的解决方案,以及利用外部数据集和技巧提高数据质量。实验证明该解决方案在DataComp基线的基础上取得了显著进展,筛选轨道改善了6.6%,BYOD轨道改善了48.5%。

基于图像文本相似度和标题修改的数据比赛挑战:过滤轨道和自带设备轨道的利用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-23T00:00:00Z

该研究探索了预训练语言与视觉模型在基本语言构造方面的处理程度,并提出了 BLA 评估基准。研究发现,各种类型的基于 Transformer 的系统在零样本设置下难以处理 BLA,但生成型的 BLIP2 在上下文学习环境中显示出有希望的趋势。

BLA 基准:研究预训练多模态模型的基本语言能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-23T00:00:00Z
[论文阅读] BLIP2

BLIP-2是一种通用且高效的视觉与语言预训练策略,通过两阶段预训练的轻量Querying Transformer来弥合模态差距。BLIP-2在多个视觉语言任务上取得了SOTA结果,包括图像命名、视觉问答和图像文本检索。模型结构包括图像转换器和文本Transformer。

[论文阅读] BLIP2

MiaoHN's Blog
MiaoHN's Blog · 2023-06-26T11:54:59Z

本文介绍了 BLiP-2 模型的代码,包括模型架构、训练参数、配置文件和测试评估代码。Blip2TextEncoder 类实现了文本编码为隐藏表示,Blip2Encoder 类实现了图像和文本编码为隐藏表示。在 forward() 函数中,Blip2Encoder 类根据输入类型调用相应的编码器,然后将它们的输出连接并应用 dropout 层。最后,使用融合门控制图像和文本的贡献,并返回输出和注意力值。

blip2代码解析 - Xu_Lin

Xu_Lin
Xu_Lin · 2023-05-15T12:14:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码