小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
STARFlow-V:基于归一化流的端到端视频生成建模

STARFlow-V是一种基于归一化流的视频生成模型,具备端到端学习、稳健的因果预测和原生似然估计等优点。该模型在时空潜在空间中操作,采用全球-局部架构,减少因果依赖,提升视频生成的一致性。通过流评分匹配和视频感知的雅可比迭代方案,STARFlow-V提高了采样效率。实验结果显示,其在视觉保真度和时间一致性方面优于基于扩散的模型,展示了归一化流在高质量视频生成中的潜力。

STARFlow-V:基于归一化流的端到端视频生成建模

Apple Machine Learning Research
Apple Machine Learning Research · 2026-04-30T00:00:00Z

MagicAnimate是一个开源项目,能够将静态人物照片转化为流畅动画。由新加坡国立大学与字节跳动联合开发,解决了传统AI动画生成中的时间一致性问题。用户只需提供照片和动作序列,即可生成高质量动画,适用于内容创作和教育等领域。该项目完全开源,使用简单,支持多种输入格式。

颠覆传统动画制作!这个AI神器MagicAnimate让静态照片秒变流畅动画,已获顶级研究团队认可

dotNET跨平台
dotNET跨平台 · 2025-06-23T00:01:04Z

本研究提出了T2VTextBench,这是首个评估视频生成模型中文本准确性和时间一致性的人类评估基准。测试结果显示,大多数模型在生成清晰一致的文本方面面临显著挑战,为未来改善视频合成中的文本处理提供了研究方向。

T2VTextBench:一种用于视频生成模型文本控制的人类评估基准

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-08T00:00:00Z

本研究提出了一种名为\(\projectname\)的零训练视频优化管道,通过神经符号反馈改善文本到视频生成模型在处理复杂提示时的语义和时间一致性问题。实验结果显示,视频与提示的对齐精度提升近40%。

Post-Processing: Improving Text-to-Video Generation with Neuro-Symbolic Feedback

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-24T00:00:00Z
突破性人工智能模型通过同时处理所有帧创建超现实视频

FullDiT是一种多任务视频生成模型,能够同时处理整个视频序列,提升文本到视频、图像到视频和视频修复的效果,展现出优越的时间一致性。

突破性人工智能模型通过同时处理所有帧创建超现实视频

DEV Community
DEV Community · 2025-03-27T10:19:43Z

本研究首次探讨视频生成中的时间一致性与多样性问题,提出FluxFlow策略,通过控制时间扰动提升视频生成模型质量。

时间性正则化增强视频生成器的能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-19T00:00:00Z
Topaz Labs 启动 Starlight 项目,这是一个用于视频增强的扩散AI

Topaz Labs推出Project Starlight,利用扩散AI技术将旧视频和低分辨率视频升级为高清视频,解决时间一致性问题。该工具支持无缝处理和功能预览,未来将推出付费版本。

Topaz Labs 启动 Starlight 项目,这是一个用于视频增强的扩散AI

实时互动网
实时互动网 · 2025-02-17T06:16:40Z

本研究提出了一种新颖的弱监督方法,通过利用相邻帧的时间一致性显著性图,提升视频流语义分割的准确性。实验结果表明,该方法显著改善了废物分类的性能。

Temporal Consistency CAMs for Weakly Supervised Video Segmentation in Waste Classification

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-03T00:00:00Z

本研究提出了一种“视频深度任意物体”模型,解决了单目深度估计在视频中的时间不一致性问题。该模型在超长视频中实现了高质量的一致性深度估计,且效率未受影响,实验结果在多个基准上创下新纪录。

Video Depth Everywhere: Consistent Depth Estimation for Super-Long Videos

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-21T00:00:00Z

本文提出了Diffusion as Shader(DaS)方法,旨在解决视频生成中的精确控制问题,提升生成视频的时间一致性和控制能力,适用于多种任务。

扩散作为着色器:3D感知视频扩散用于多样化视频生成控制

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-07T00:00:00Z

本研究提出了一种新颖的对象级时间对比损失,解决了无监督视频对象中心学习中的时间一致性问题。该方法显著提高了对象中心表示的时间一致性,支持更可靠的视频分解和无监督对象动态预测,超越了现有的弱监督方法。

通过对比槽实现时间一致的以对象为中心的学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-18T00:00:00Z

本研究提出了一种新机制,利用自适应音位池化技术解决语音深度伪造检测中的音位序列时间不一致问题,显著提升了检测准确性,实验结果优于现有技术。

Phoneme-Level Feature Differences: The Key to Detecting Complex Speech Deepfakes

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-17T00:00:00Z

该研究提出了一种混合训练框架,结合静态图像与视频数据,解决了视频人脸交换在时间一致性和复杂场景处理中的不足,显著提高了身份保持和视觉质量。

VividFace:一种基于扩散的高保真视频人脸交换混合框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-15T00:00:00Z

本研究提出了一种优化网络,解决高动态范围照明序列中的时间一致性问题,通过最小化复合损失函数来优化信号的方向、锐度和强度,从而确保HDRI序列的真实感。

将球面高斯函数拟合到动态高动态范围图像序列

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-09T00:00:00Z

本研究提出了PaintScene4D框架,旨在生成真实感动态4D场景。该框架通过多样数据集训练的视频生成模型和摄像机阵列选择,实现了空间和时间的一致性,提升了场景的真实感与灵活性。重要发现是其无训练架构能够高效生成可从任意轨迹查看的4D场景。

PaintScene4D:基于文本提示的一致性4D场景生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z

本研究提出了一种基于深度Q网络的算法,用于解决大规模纵向数据的生存分析。通过时间一致性理论,该方法在长序列数据集上表现优于传统方法,提高了训练的稳定性和可靠性。

深度端到端生存分析与时间一致性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-09T00:00:00Z

本研究提出了HE-Drive,一种以人为中心的自动驾驶系统,解决时间一致性和舒适性问题。通过3D空间表示和条件去噪模型,生成高舒适度驾驶轨迹。实验结果优异。

HE-Drive: Human-Simulated End-to-End Driving Based on Visual Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-07T00:00:00Z

本研究提出了VideoFusion、Motion Generation和MoVideo框架等视频生成方法,利用潜在扩散模型和自编码器提升视频生成的质量和效率。通过分解噪声和建模时间运动,改善了视频的时间一致性和视觉连贯性,推动了文本到视频生成技术的发展。

COMUNI:基于扩散的视频生成中常见和独特视频信号的分解

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-02T00:00:00Z

本文提出了一种新方法,结合动态3D网格和扩散模型,自动生成高质量的4D视频内容。该方法通过文本引导的四维化技术,优化时间一致性和视觉效果,支持基于实际场景的生成,提升用户控制能力。研究介绍了Efficient4D和Diffusion4D框架,强调生成效率和几何一致性,实现从单目视频生成空间时间一致的4D内容。

Phy124:基于物理驱动的快速4D内容生成方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-11T00:00:00Z

本文介绍了一种新的视频修复方法,结合光流场和扩散模型,确保视频内容的时空连贯性。该方法在多个数据集上表现优异,能够高效生成高质量的视频修复效果,并有效解决时间一致性和对象插入等问题。

视频扩散模型是强大的视频修复工具

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-21T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码