小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
人工智能突破:无图像训练视觉模型将计算成本降低37倍

Unicorn通过仅使用文本数据训练视觉语言模型(VLMs),消除了图像生成的需求,性能达到基于图像方法的90%,计算成本降低37倍,证明VLMs能够从纯文本中学习视觉概念。

人工智能突破:无图像训练视觉模型将计算成本降低37倍

DEV Community
DEV Community · 2025-04-03T10:48:12Z

本研究探讨深度视觉模型的可解释性,提出了解释链(CoE)方法,通过自动解码视觉概念,创建全球概念解释数据集,并设计多义性解开与过滤机制。实验结果表明,CoE在解释性得分上平均提高了36%。

通过自动视觉概念电路的解释链(CoE):描述与多义性量化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-19T00:00:00Z

本研究探讨深度神经网络在决策过程中的相似性与差异性,提出了一种可解释的表示相似性方法(RSVC),以识别模型间共享和独特的视觉概念。研究结果表明,模型的差异源于某些独有概念未被另一模型有效表示,验证了该方法的有效性。

通过可解释的视觉概念进行表示相似性分析

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-19T00:00:00Z
关于AGI的IDC - 人工智能已经在重新定义平面设计

人工智能正在革新平面设计,提升设计质量。AI自动化重复任务,生成视觉概念,优化色彩和排版,加速原型设计,简化市场材料创建。设计师应结合人类直觉,合理利用AI以推动创意发展。

关于AGI的IDC - 人工智能已经在重新定义平面设计

DEV Community
DEV Community · 2025-02-07T13:04:40Z

本研究提出了一种构建与视觉概念对齐的头相关向量(HRVs)的方法,以解决文本到图像生成模型中跨注意力层理解不足的问题,从而提高图像生成的准确性和可控性。

Cross-Attention Head Position Patterns and Alignment with Human Visual Concepts in Text-to-Image Generation Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-03T00:00:00Z

该研究论文介绍了LaMI策略在图像识别中的应用,通过构建视觉概念和分析类别之间的视觉相似性,解决了概念表示不足和过度拟合的问题,且在无需外部训练资源的条件下表现出卓越的性能。

LaMI-DETR: 通过语言模型指令进行开放词汇检测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-16T00:00:00Z

本研究提出了一种名为InFiConD的新框架,通过利用视觉概念实现知识蒸馏过程并实现后续的零代码微调学生模型,解决了在计算资源有限的环境中部署大型预训练模型的挑战。

InFiConD:基于概念的知识蒸馏的交互式无代码微调

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-25T00:00:00Z

研究发现,大型多模态模型在生成、检测和分类视觉概念方面的能力是模型特定且不可转移的。通过对三种先进模型进行分析,发现新的词嵌入是模型特定且不可转移的。研究还展示了软提示微调方法在视觉概念学习任务中发现这些扰动解,而视觉概念的嵌入是不可转移的。

跨模型理解视觉概念

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-11T00:00:00Z

我们引入了一种语义面板作为中介来解码文本到图像的过程,用于支持生成器更好地遵循指示。通过将从输入文本解析的视觉概念经由大型语言模型的辅助排列而成的面板注入到去噪网络作为详细的控制信号来补充文本条件,我们的方法 Ranni 在提高预训练的 T2I 生成器的文本可控性方面取得了进展。我们开发了一个实用系统,并展示了其在连续生成和基于聊天的编辑中的潜力。

PaRa: 個性化文本到圖像擴散通過參數等級降低

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-09T00:00:00Z

该工作提出了一种元学习算法,模拟了大型语言模型的能力,通过学习新的视觉概念而无需微调。该方法利用预训练特征提取器,并将元学习重新构造为对已知和未知标签的数据点进行序列建模。在8个元学习基准中,超过或与最先进算法相匹配,无需元训练或微调。

变色龙:一种在野外进行密集视觉预测的数据高效通用模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-29T00:00:00Z

大型文本到图像模型的能力引起了变革,但对于特定视觉概念,原始模型无法捕捉。本文提出了一种新的数据集生成策略,解决文本连贯性和身份保留问题,提高图像质量并生成多样样本。实验证明该方法在质量、保留、多样性和对齐方面取得了平衡。

培养多轮思维的文本引导图像生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-16T00:00:00Z

本文介绍了一种元学习算法,通过学习新的视觉概念而无需微调,模拟了大型语言模型的能力。该方法利用预训练特征提取器,并将元学习重新构造为对已知标签和未知标签的数据点进行序列建模。在8个元学习基准中,超过或与最先进算法相匹配,无需元训练或微调。

元先验:自适应逆问题求解的元学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-30T00:00:00Z

该文介绍了一种元学习算法,无需微调即可学习新的视觉概念,模拟了大型语言模型的能力。该方法在11个元学习基准中的8个中超过或与最先进算法相匹配,无需元训练或微调。

上下文感知元学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-17T00:00:00Z

本文介绍了 VeCLIP,一种用于 web 数据集训练的新方法,通过整合视觉概念和标题,改善数据质量和多样性,提高了图片-文本对齐和整体模型性能。

从稀缺到高效:通过视觉丰富的标题改进 CLIP 训练

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-11T00:00:00Z
人工神经网络中的多模态神经元

研究发现CLIP中的神经元对同一概念的反应在字面、符号和概念层面上保持一致,这解释了其在视觉概念分类中的高准确性,并有助于理解其学习过程中的关联和偏见。

人工神经网络中的多模态神经元

OpenAI
OpenAI · 2021-03-04T08:00:00Z
CLIP:连接文本与图像

CLIP是一种神经网络,通过自然语言监督高效学习视觉概念,能够在任何视觉分类基准上应用,只需提供视觉类别名称,具备类似于GPT-2和GPT-3的“零样本”能力。

CLIP:连接文本与图像

OpenAI
OpenAI · 2021-01-05T08:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码