小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
BrushNet与BrushEdit解析:从图像修复架构到智能编辑

本文介绍了BrushNet和BrushEdit两个AI模型。BrushNet通过双分支架构实现图像修复,逐步学习填补空白;BrushEdit则将自然语言指令转化为修复所需的掩码和提示,自动化处理过程。两者结合增强了图像编辑能力。

BrushNet与BrushEdit解析:从图像修复架构到智能编辑

Yi's blog
Yi's blog · 2026-02-07T18:00:00Z

该研究提出了Lumina-OmniLV框架,旨在提升低级视觉领域100多个子任务(如图像修复和增强)的多任务泛化能力,并探讨高级生成任务对细节修复的影响。

Lumina-OmniLV:统一的多模态框架用于通用低级视觉

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-07T00:00:00Z

本研究提出了一种新颖的特征适应框架,旨在改善深度神经网络在大面积水印去除中的不足。通过融合水印下的背景信息与图像修复模型的特征,该模型显著提升了去水印效果,降低了对水印遮罩质量的敏感性。

Bridging the Knowledge Gap Between Image Inpainting and Large-Area Visible Watermark Removal

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-07T00:00:00Z

本研究提出了一种名为“多尝试,更美味”(TMTB)的框架,旨在降低密集场景中的标注成本。通过图像修复技术和视觉状态空间模型,增强数据多样性,显著提高了在极端拥挤和低光环境下的人群计数准确性。实验结果表明,该方法在多个基准数据集上超越了现有最优方案。

Taste More, Taste Better: Enhancing Semi-Supervised Crowd Counting with Diverse Data and Strong Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-23T00:00:00Z

本研究提出了一种新颖的缺陷生成方法DefectFill,旨在解决视觉检查模型中缺陷数据稀缺的问题。该方法利用优化的图像修复扩散模型生成高质量缺陷图像,从而提升了视觉检查模型在MVTec AD数据集上的性能。

DefectFill: Realistic Defect Generation and Image Inpainting Diffusion Model for Visual Inspection

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-18T00:00:00Z

本研究提出了TextDoctor方法,旨在解决数字文档修复中的风格泛化和高分辨率处理问题。该方法通过补丁恢复文本元素,并应用扩散模型,实现高效的图像修复。研究结果表明,TextDoctor在高分辨率文档恢复方面优于现有方法,具有显著的实用价值。

TextDoctor: Unified Document Image Inpainting via Patch Pyramid Diffusion Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-06T00:00:00Z

本文提出了一种创新框架,通过稳定扩散的图像修复技术,最多可将深度学习驱动的杂草控制系统的训练数据增加200%。该方法在目标检测模型上进行评估,显著提升了智能杂草管理系统的检测准确性和计算效率。

Exploration of Model Quantization for Detecting Cultivable Plants Based on Generative AI Image Inpainting

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-04T00:00:00Z

本研究提出了一种基于随机最优控制的统一扩散桥框架UniDB,旨在解决现有扩散桥模型在图像翻译和修复中存在的模糊和细节损失问题。通过优化问题的求解,UniDB显著提高了图像细节保留和输出质量,验证了其优越性和适应性。

UniDB: A Unified Diffusion Bridge Framework via Stochastic Optimal Control

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-09T00:00:00Z
Allenhooo在Replicate上发布的Lama模型初学者指南

Lama模型由Roman Suvorov及其团队开发,是一种高效的图像修复系统,能够填补高分辨率图像中的大面积缺失区域,尤其擅长处理复杂几何结构和周期性图案。输入为图像及其掩码,输出为完整图像。

Allenhooo在Replicate上发布的Lama模型初学者指南

DEV Community
DEV Community · 2025-01-15T08:41:49Z

本文提出了一种新方法InpDiffusion,旨在解决图像修复定位中的过度自信和边界检测困难问题。通过引入边缘条件和监督策略,提升了修复图像的细节感知,显著提高了定位的准确性和鲁棒性。

InpDiffusion: Image Inpainting Localization via Conditional Diffusion Model

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-06T00:00:00Z

该研究提出了DiffRatio-MoD框架,解决了扩散变换器在资源受限设备上的高延迟和内存低效问题。通过动态计算路由,令牌计算需求可适应性调整,显著提升了生成质量与效率的平衡。实验结果表明,该方法在文本到图像生成和图像修复任务中优于现有技术。

Layer- and Timestep-Adaptive Differentiable Token Compression Ratios for Efficient Diffusion Transformers

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-22T00:00:00Z

本研究探讨条件潜在扩散模型(CLDMs)在图像修复中的应用,发现其在捕捉高层语义方面表现优异,但在提升图像感知质量和处理轻微降质时存在困难,传统方法更具优势。

条件潜在扩散模型在图像修复中的有效性研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

本文提出了一种新颖的区域感知扩散模型(RAD),有效解决了现有图像修复方法的不足。该模型通过不同的噪声调度实现局部区域的异步生成,推断速度比最新方法快100倍,并在多个数据集上表现优异。

Region-Aware Diffusion Model for Image Inpainting

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

本研究提出了一种新的异步扩散薛定谔桥(AsyncDSB)方法,解决了图像修复中的调度恢复不匹配问题。该方法通过优先调度高频率像素,显著提升了图像修复质量,FID指标比现有方法提高约3%至14%。

AsyncDSB: Scheduling Asynchronous Diffusion Schrödinger Bridge for Image Inpainting

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-11T00:00:00Z

本研究提出了一种生成模型,解决了基于扩散模型的图像修复中的3D不一致性问题,通过引入场景替代视角,实现了3D一致性和语义连贯性。实验结果表明,该方法在多个数据集上优于现有技术。

基于扩散模型的3D一致性图像修复

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-08T00:00:00Z

本研究提出“复杂性专家”概念,解决传统混合专家架构在任务适应性不足的问题。通过分配不同计算复杂度和感受野的专家,提升图像修复性能,验证了该方法在效率和实际应用中的优势。

Complexity Experts as Task-Distinguishing Learners for Any Image Restoration

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-27T00:00:00Z
实时格式化和检查错误代码:提升网页项目开发效率的工具链 | 开源日报 No.422

Video-LLaVA 通过对齐学习实现图像与视频的交互,支持多模态推理。RAG 是一个自然语言聊天机器人,帮助用户创建 RAG 管道。Biome 提供网页项目的格式化和检查工具,支持多种语言。Tree-of-thoughts 提升模型推理能力,Adetailer 自动检测和修复图像。

实时格式化和检查错误代码:提升网页项目开发效率的工具链 | 开源日报 No.422

开源服务指南
开源服务指南 · 2024-11-14T23:35:45Z

本文全面综述了基于扩散模型的图像修复方法,评估其应用并提出未来研究的五个方向。

DreamClear:高容量的真实世界图像恢复与隐私安全的数据集策划

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-24T00:00:00Z

本文介绍如何使用Stable Diffusion创建图像修复服务,并部署到Koyeb。步骤包括环境设置、实现修复功能、创建Web界面、Docker化应用和部署。通过Gradio,用户可上传图像和遮罩进行修复,实现可扩展的服务。

使用Stable Diffusion和PyTorch构建图像修复服务

DEV Community
DEV Community · 2024-10-13T22:00:00Z

这篇论文全面概述了利用扩散模型进行图像编辑的方法,分析了学习策略、用户输入条件和特定编辑任务。特别关注图像修复和扩展,比较了传统上下文驱动方法与多模态条件方法。最后,讨论了当前的限制并展望未来研究方向。

离散反演:可控编辑的多项式扩散和掩码生成模型启用方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-10T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码