小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了HintsOfTruth数据集,包含27,000对真实与合成图像/声明,旨在自动检测多模态检查值得性声明。研究表明,轻量级文本编码器在识别非声明内容方面表现良好,而多模态大语言模型在合成数据上更具鲁棒性,但计算成本高,限制了其大规模应用。

HintsOfTruth: A Multimodal Dataset for Credibility Detection of Real and Synthetic Claims

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-17T00:00:00Z

本研究提出IISAN-Versa框架,以解决多模态基础模型在序列推荐中的适应性不足问题。该框架通过高效微调和模态适应,提升文本编码器性能,推动推荐系统研究进展。

Efficient Adaptation of Multimodal Foundation Models in Sequential Recommendation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-05T00:00:00Z

研究提出TUMSyn模型,通过文本提示生成多模态脑MRI图像,利用对比学习预训练的文本编码器确保图像精度和多样性,具有临床应用潜力。

面向定制化多模态脑MRI生成的通用文本引导图像合成研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-25T00:00:00Z

本文提出了一种新颖的概念擦除方法,通过更新文本编码器和对抗训练,实现快速且自然的概念擦除。研究表明,现有方法无法完全抹除目标概念,强调了概念消除的脆弱性。所提出的框架在去除不良概念的同时,保留了模型性能,展示了概念表征的弹性和流动性。

ConceptPrune: 通过技能神经元修剪在扩散模型中进行概念编辑

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-29T00:00:00Z

本文介绍了一种改进的CLIP模型,通过微调文本编码器和引入大规模语言模型,提升了图像释义的表现。ParaCLIP在释义检索和语义文本相似度任务中表现优异,并在半监督图像标注和细粒度图像重识别应用中显示出显著的性能提升。

为改写检索调整双编码图像 - 语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-06T00:00:00Z

本文探讨了生成式大型语言模型(LLMs)在跨语言词汇适应、视觉-语言模型集成和语音合成等任务中的应用。研究表明,跨语言适应可提升推理速度,模型集成显著提高准确率,而LLMs作为文本编码器在语音合成中表现最佳。此外,集成技术与进化算法结合有助于提升生成文本质量。

跨越 LLM 集成中不同词汇之间的鸿沟

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-15T00:00:00Z

本文介绍了多种基于扩散模型的图像生成技术,包括通过缩放因子改善图像质量、简化模型以降低复杂度,以及引入多语言支持的AltDiffusion模型。研究表明,合成图像在训练分类器时表现不佳,但在特定条件下扩大合成数据规模有效。通过优化文本编码器,提升了文本图像生成的准确性,展示了多种潜在应用。

基于扩散的文本到图像生成的可扩展性研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-03T00:00:00Z

LSeg是一种新的语言驱动的语义图像分割模型,使用文本编码器和基于transformer的图像编码器计算输入标签和图像的嵌入。LSeg具有高度竞争的零-shot性能,能够对未知类别进行泛化,无需重新训练或仅需要单个样本的训练。

探索简化开放词汇语义分割

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-22T00:00:00Z
Multimodal and Large Multimodal Models (LMM)

本文介绍了CLIP模型的训练目标、编码器、嵌入空间、数据集和应用。CLIP使用对比学习训练,提高效率和生成高质量的图像嵌入。CLIP可用于图像分类和基于文本的图像检索,但在图像检索方面表现较低。

Multimodal and Large Multimodal Models (LMM)

DemoChen's Clip
DemoChen's Clip · 2023-10-11T21:50:23Z
stable_diffusion学习

本文介绍了稳定扩散模型的结构和流程,通过在低维潜在空间上应用扩散过程来降低内存和计算复杂性。该模型包括自动编码器、U-Net和文本编码器等模块,通过噪声调度算法进行去噪过程。文章还提供了代码实现。

stable_diffusion学习

Sekyoro的博客小屋
Sekyoro的博客小屋 · 2023-10-04T06:30:57Z
StableDiffusion笔记

Stable Diffusion是一种图像生成方法,由Stability AI和Runway基于LDM1提出。该方法通过随机种子生成噪声,利用文本编码器将输入提示转换为向量,并通过Unet网络处理,最终生成高分辨率图像。Unet中加入了交叉注意力机制,提升了生成效果。

StableDiffusion笔记

plus studio
plus studio · 2023-05-29T15:36:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码