小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
搭建我的家庭实验室

圣诞假期是进行爱好项目的好时机。作者尝试在本地运行开源的deepseek模型,尽管硬件较旧,但仍乐在其中。使用Ubuntu虚拟机设置环境,虽然速度慢,但体验有趣。计划进行三个家庭实验,包括使用Python脚本调用本地LLM、测试不同LLM性能和安装稳定扩散生成图片。

搭建我的家庭实验室

DEV Community
DEV Community · 2025-05-05T13:53:57Z

该研究提出了一种新方法,结合稳定扩散的想象网络和增强学习,有效利用视觉信息,显著提升多模态翻译效果。

Making Imagination Clearer! Visual Imagination in Multimodal Machine Translation Based on Stable Diffusion

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-17T00:00:00Z

本研究提出了一种新的渲染精化稳定扩散(RefSD)方法,解决了传统伪匿名化技术在保护图像数据集身份隐私时的实用性问题。该方法结合3D渲染与稳定扩散技术,提升了数据的真实性和可定制性,训练模型在检测任务中的表现优于真实数据。

隐私合规合成数据的渲染精化稳定扩散研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-09T00:00:00Z

本研究提出DiffPano框架,旨在解决3D场景和360度图像生成中的数据集不足和复杂性问题。通过利用大规模视频-文本数据集和稳定扩散技术,实现了一致且多样的全景图像生成。

DiffPano:可扩展且一致的基于文本的全景生成方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

研究介绍了一种基于多模态大型语言模型的生成助手(LLMGA),通过精确控制生成提示来优化图像生成和编辑。采用两阶段训练方案和参考恢复网络,提升生成效果并减少编辑差异。实验显示,LLMGA具备出色的生成能力和应用潜力。

记忆、检索与生成:作为您个人助手的无限视觉概念理解

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-17T00:00:00Z

本研究提出了一种新方法,利用稳定扩散生成高质量的合成海洋数据,以训练基于YOLOv10的视觉模型,实现了牡蛎检测的最新效果。该系统提升了牡蛎栖息地监测的效率,也为海洋环境中的自主监控提供方案,推动水产养殖与保护工作的发展。

ODYSSEE:边缘电子设备上的牡蛎检测传感器系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-11T00:00:00Z

谷歌开发的新游戏引擎“Game and Gen”使用人工智能技术实时创建游戏世界,无需传统编码。该引擎受到1993年游戏“Doom”的启发,使用稳定扩散和强化学习等先进技术。AI负责游戏的图形、角色和环境交互。尽管“Game and Gen”目前还不适用于商业游戏,但其潜力巨大,未来可能应用于机器人等领域。AI和机器人的发展将在未来发挥重要作用。

游戏开发的未来(无需引擎!😢)

DEV Community
DEV Community · 2024-08-30T04:05:12Z

本文介绍了DiffCLIP,一种新的预训练框架,结合稳定扩散和ControlNet,减小视觉分支中的域间差异,并引入样式提示生成模块,用于少样本任务。实验结果显示DiffCLIP在ModelNet10、ModelNet40和ScanObjectNN数据集上具有强大的3D理解能力。在ScanObjectNN的OBJ_BG数据集上,DiffCLIP实现了43.2%的零样本分类精度,是最先进的技术水平;在ModelNet10上实现了80.6%的零样本分类精度,与最先进的技术水平相当。

基于 CLIP 的点云分类:通过点云到图像的转换

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-07T00:00:00Z

本研究通过稳定扩散生成新图像,探讨了一种新的方法来创建先进的视觉问答模型。通过测试基线和最新的VQA模型的组合,评估它们对未来数据分布的性能。研究强调了创建大规模未来偏移数据集的重要性,以增强VQA模型的稳健性。

连续学习的时间敏感问答

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-17T00:00:00Z
稳定扩散中的图像修复与扩展

稳定扩散是一种先进的图像处理技术,用于修复图像中的缺失像素或重建图像区域。它使用文本编码器、U-Net和变分自编码器等组件。稳定扩散还提供了Inpaint Anything扩展,方便创建遮罩。此外,它支持图像外扩技术,生成与原始图像上下文一致的新像素。稳定扩散是一种强大的生成AI工具,适用于生成、修复和扩展图像等任务。

稳定扩散中的图像修复与扩展

MachineLearningMastery.com
MachineLearningMastery.com · 2024-04-24T18:20:23Z
稳定扩散的提示技巧

本文介绍了使用稳定扩散生成图片的关键技术,包括模型、采样器和步数。合理构建提示可以帮助生成理想的图片,包括主题、媒介、艺术风格、著名艺术家、网站、分辨率、光照和颜色等。稳定扩散的输出结果因模型不同而异,需要不断尝试找到最佳生成效果。

稳定扩散的提示技巧

MachineLearningMastery.com
MachineLearningMastery.com · 2024-04-14T19:20:36Z
稳定扩散技术简介

GPT-3的引入标志着生成AI(GenAI)革命的开始。稳定扩散是GenAI家族中的一员,具有自定义性、可在自己的硬件上运行和不断改进的特点。稳定扩散在从文本和现有图像生成图像方面取得了显著成功。稳定扩散通过投影输入到降维潜在空间中,通过编码器和解码器网络减少计算需求。可以通过WebUI和CompfyUI两种方式在计算机上使用稳定扩散。

稳定扩散技术简介

MachineLearningMastery.com
MachineLearningMastery.com · 2024-04-06T14:33:10Z

本研究通过稳定扩散生成新图像,探讨了一种新的方法来创建先进的视觉问答模型。通过评估七个基线和最新的VQA模型的组合,研究突出了创建大规模未来偏移数据集的重要性,以增强VQA模型的稳健性。

TinyVQA: 资源受限设备上用于视觉问答的紧凑多模态深度神经网络

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-04T00:00:00Z

通过引入合成艺术作品,研究了人造艺术品检测性能的提升潜力。使用稳定扩散和StyleGAN生成的图像进行训练,发现合成伪造品能够提高对人造伪造品的检测能力。同时,训练数据中包含合成伪造品也能有效检测出由人工智能生成的伪造品。

深度图像合成与图像伪造

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-03T00:00:00Z

该研究揭示了稳定扩散计算机视觉模型的隐私漏洞,并提出了一种新的会员推理攻击方法。研究评估了攻击的有效性,并呼吁采取增强安全措施。

振荡泄密:微调扩散模型能够放大生成的隐私风险

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-14T00:00:00Z

该研究揭示了稳定扩散计算机视觉模型的隐私漏洞,并设计了一种黑盒会员推理攻击方法,成功率达到60%。研究强调了隐私和安全问题的迫切性,敦促从业者和开发者采取增强安全措施。

模型将明示:扩散模型的训练成员推断

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-13T00:00:00Z

本研究探讨了利用预训练的稳定扩散进行盲目人脸修复的潜力,并提出了BFRffusion方法。该方法能从低质量的人脸图像中提取特征并生成逼真的面部细节。研究还构建了平衡人种、性别和年龄等属性的隐私保护人脸数据集PFHQ,解决了隐私和偏见问题。实验证明BFRffusion在盲目人脸修复上达到最先进的性能水平,PFHQ是训练网络的资源。

PFStorer:个性化人脸修复与超分辨率

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-13T00:00:00Z

本研究通过稳定扩散生成新图像,探讨了一种新的方法来创建先进的视觉问答模型。通过评估七个基线和最新的VQA模型的组合,研究突出了创建大规模未来偏移数据集的重要性,以增强VQA模型的稳健性。

通过梯度引导的模型扰动增强医学视觉问答任务的泛化能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-05T00:00:00Z

本研究通过稳定扩散生成新图像,探讨了一种新的方法来创建先进的视觉问答模型。通过测试基线和最新的VQA模型的组合,评估它们对未来数据分布的性能。研究强调了创建大规模未来偏移数据集的重要性,以增强VQA模型的稳健性。

视觉去幻化指令生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-13T00:00:00Z

该研究介绍了一种基于多模态大型语言模型的生成助手(LLMGA),通过精确控制生成提示实现对稳定扩散(SD)的控制,提供更精细、准确的内容和更直观的网络解释性。实验结果表明,LLMGA 具有很好的生成能力,并能在更广泛的应用中发挥作用。

LLaGA:大型语言和图形助手

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-13T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码