谷歌推出Nano Banana 2(Gemini 3.1 Flash Image),为免费用户提供更强大的AI图像生成工具。该模型利用实时信息和网络搜索图像,能够生成复杂、准确的图像,支持可读文本和本地化翻译。用户可以灵活控制图像细节和分辨率,Nano Banana 2将取代Nano Banana Pro,成为谷歌AI视频工具的默认生成模型。
本研究提出了一种新的语义引导全局-局部协作网络(SGGLC-Net),旨在解决单幅图像超分辨率中的模糊与细节丢失问题。通过引入语义指导和全局-局部协作模块,该方法显著提升了图像细节质量,实验结果表明其在多个基准数据集上优于现有轻量级超分辨率方法。
谷歌确认Zoom Enhance功能将在Pixel 8 Pro上推出,并将在Pixel 9 Pro、9 Pro XL和9 Pro Fold上首次推出。该功能可以智能地增强图像细节,使用户能够更近距离地观察图像。谷歌在去年的Made by Google活动中宣布了这一基于人工智能的功能,但直到现在才准备好发布。这次谷歌的相机软件更新还包括Add Me、Reimagine in Magic Editor等功能。
新成立的 Black Forest Labs 旨在推进高质量生成式深度学习模型,已完成 3100 万美元的种子轮融资。他们推出了三个变体模型 FLUX.1,具有丰富的图像细节和多样化风格,超越了其他竞争对手。Black Forest Labs 还计划推出 SOTA 文生视频模型。
Deshadow-Anything是一种模型,可以通过扩散模型沿着图像的边缘和纹理进行扩散,帮助去除图像中的阴影并保留图像的细节。该模型还设计了多自注意引导和自适应输入扰动来加速扩散的迭代训练速度。实验证明,这些方法可以有效提高图像修复性能。
本文介绍了一种通过单个真实图像和目标文本实现复杂文本语义编辑的新方法。该方法利用扩散模型生成与输入图像一致的编辑图像,涉及优化文本嵌入、微调模型和线性插值。实验表明,微调对保留图像细节至关重要,但存在编辑效果微弱和影响外部细节的局限性。未来的研究将集中在提高准确性和减少社会偏见上。
完成下面两步后,将自动完成登录并继续当前操作。