小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
国产世界模型登顶全球第一!断层领先谷歌英伟达,3D准确度近满分

极佳视界的GigaWorld-1模型在WorldArena评测中获得全球第一,超越谷歌和英伟达,展现出在物理遵循、3D准确度和视觉质量方面的领先技术,推动具身智能生态的发展。

国产世界模型登顶全球第一!断层领先谷歌英伟达,3D准确度近满分

量子位
量子位 · 2026-03-30T03:55:06Z
Nano Banana 2已在AI Gateway上线

Gemini 3.1 Flash Image Preview(Nano Banana 2)现已在AI Gateway上线。该版本提升了视觉质量,支持Google图像搜索,能更好地渲染不知名地标和物体,并引入可配置的思维水平。新增分辨率和纵横比,支持更多创意资产。使用时需设置模型为google/gemini-3.1-flash-image-preview。

Nano Banana 2已在AI Gateway上线

Vercel News
Vercel News · 2026-02-26T13:00:00Z
游戏开发者理解屏幕分辨率的指南

游戏开发者应重视分辨率,它是视觉质量的基础。分辨率影响艺术资产的缩放、UI显示和不同设备上的游戏体验。高分辨率提供更多细节,但需优化以避免帧率下降。开发者应测试不同分辨率,确保游戏在各种设备上表现一致。理解分辨率、缩放和像素密度的关系,有助于提升游戏的视觉效果和可玩性。

游戏开发者理解屏幕分辨率的指南

freeCodeCamp.org
freeCodeCamp.org · 2025-11-19T15:59:38Z

本文介绍了JoyGen框架,该框架通过130小时中文视频数据集解决了音频与唇部动作的同步及视觉质量问题,推动了AIGC领域的发展。

JoyGen:音频生成逼真的3D说话人脸视频

京东科技开发者
京东科技开发者 · 2025-07-02T06:26:48Z

PosterAgent是一个开源框架,可以将学术论文快速转换为高质量海报,效果优于GPT-4o,且成本低。它通过Paper2Poster评估标准,优化海报的视觉效果和文本连贯性,适合学术会议和课程资料制作。

论文秒变海报!开源框架PosterAgent一键生成顶会级学术Poster

量子位
量子位 · 2025-06-03T09:24:46Z
机器学习如何改变游戏开发中的视觉验证:一个DevOps成功案例

在竞争激烈的游戏开发中,视觉质量至关重要。传统的手动验证方法已不再有效,导致渲染缺陷难以发现。我们通过将基于图像的机器学习分类集成到DevOps流程中,实现了自动化视觉验证,提升了开发效率。该系统成功识别了多个关键回归问题,显著提高了开发流程的可靠性和稳定性。

机器学习如何改变游戏开发中的视觉验证:一个DevOps成功案例

8th Light Insights
8th Light Insights · 2025-05-22T19:33:00Z

本研究提出了ManipDreamer,通过引入动作树和视觉引导,显著提升了机器人操控视频合成中的指令跟随和视觉质量。

ManipDreamer: Enhancing Robotic Manipulation World Models through Action Trees and Visual Guidance

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-23T00:00:00Z

本研究提出了一种新方法4DGS-1K,旨在解决现有4D高斯散点技术在动态场景重建中的存储需求和渲染速度问题。该方法通过引入时空变化评分,显著降低了存储需求,并实现了超过1000帧每秒的渲染速度,同时保持了视觉质量。

4D Gaussian Splatting Technology for Dynamic Scene Rendering at 1000+ Frames Per Second

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-20T00:00:00Z

本研究探讨了单图像超分辨率(SISR)的挑战,提出了一种通过多模态上下文信息(如深度、分割、边缘和文本提示)在扩散模型中学习生成先验的新方法。实验结果表明,该模型在视觉质量和保真度上优于现有方法,具有重要的应用潜力。

上下文的力量:多模态如何改善图像超分辨率

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-18T00:00:00Z

本研究提出了一种对角解码方法,解决自回归Transformer模型在视频生成中的速度瓶颈。该方法通过利用时空相关性,实现帧内并行解码,推断速度提升最高可达10倍,同时保持视觉质量。

Fast Autoregressive Video Generation with Diagonal Decoding

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-18T00:00:00Z
Wan-Video在Replicate上的Wan-2.1-1.3b模型初学者指南

Wan-2.1-1.3b是由Wan-Video维护的先进视频生成模型,能够根据文本描述生成5秒480p的视频。该模型采用扩散变换器架构,支持中英文输入,具备良好的视觉质量和运动连贯性,用户可调整参数以控制生成过程。

Wan-Video在Replicate上的Wan-2.1-1.3b模型初学者指南

DEV Community
DEV Community · 2025-03-01T07:28:10Z

本研究提出了一种一致性流动蒸馏(CFD)方法,以解决文本到3D生成中的视觉质量和多样性问题。实验结果表明,CFD方法显著优于传统技术。

Consistency Flow Distillation for Text-to-3D Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-09T00:00:00Z

本研究提出了一种改进的耦合归一化流模型,旨在提升自然图像生成的视觉质量。尽管整体质量仍有待提高,但在数量和质量性能上已达到先进水平,展现了其在复杂生成模型中的潜力。

Jet Flow: Normalizing Flows Based on Modern Transformers

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-19T00:00:00Z

该研究提出了一种混合训练框架,结合静态图像与视频数据,解决了视频人脸交换在时间一致性和复杂场景处理中的不足,显著提高了身份保持和视觉质量。

VividFace:一种基于扩散的高保真视频人脸交换混合框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-15T00:00:00Z

本研究提出了一种名为HUPE的启发式可逆网络,旨在解决水下图像因光折射和吸收导致的可视性降低问题。HUPE通过可逆变换与傅里叶变换实现水下图像与清晰图像的双向映射,并引入语义协同学习模块,显著提升视觉质量和特征提取能力。实验结果表明,HUPE的增强效果优于现有方法。

HUPE: Heuristic Underwater Perceptual Enhancement Based on Semantic Collaborative Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-27T00:00:00Z

本研究提出了向量化粒子基得分蒸馏(VPSD)方法,显著提升了文本指导的SVG生成在可编辑性、视觉质量和多样性方面的表现。实验结果表明,该方法优于传统技术,并支持多种向量风格。

SVGDreamer++: Enhancing Editability and Diversity in Text-Guided SVG Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-26T00:00:00Z

本研究提出了一种低复杂度的实时超分辨率模型RTSR,旨在提升视频压缩内容的视觉质量,特别是从360p到1080p及540p到4K的分辨率。该模型通过优化的卷积神经网络和双教师知识蒸馏方法,实现了复杂性与编码性能的最佳平衡,为实时视频播放提供了有效解决方案。

RTSR: A Real-Time Super-Resolution Model for AV1 Compressed Content

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-20T00:00:00Z

本研究提出线性情感空间(LES)和跨维注意力网络(CDAN),以解决一体化虚拟人物生成模型在细粒度情感编辑中的不足。实验结果表明,该方法在视觉质量和可控性方面优于主流技术。

LES-Talker:线性情感空间中可控的细粒度情感编辑与虚拟人物生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-14T00:00:00Z

本研究提出了LapGSR模型,旨在解决低分辨率图像在多模态数据融合中的视觉质量问题。该模型通过拉普拉斯金字塔提取边缘信息,降低计算负担,同时保持图像细节。实验结果表明,LapGSR在ULB17-VT和VGTSR数据集上表现优异,且参数数量显著少于其他模型。

LapGSR: Laplacian Reconstruction Network for Guided Thermal Super-Resolution

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-12T00:00:00Z

本研究提出MVSplat360方法,解决360度新视图合成中的稀疏观察问题,显著提升仅用5个稀疏视图的合成质量,实验结果表明其视觉效果优于现有技术。

MVSplat360:基于稀疏视图的前馈360场景合成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-07T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码