小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
LongCat-Video 视频生成模型正式发布,探索世界模型的第一步

美团LongCat团队推出的LongCat-Video视频生成模型,通过多任务统一架构,实现高质量长视频生成,具备良好的时序一致性和物理合理性,为自动驾驶等应用奠定基础。

LongCat-Video 视频生成模型正式发布,探索世界模型的第一步

美团技术团队
美团技术团队 · 2025-10-27T00:00:00Z
CVPR 2025|视频抠图MatAnyone来了,一次指定全程追踪,发丝级还原

南洋理工大学与商汤科技联合研发的MatAnyone视频抠图技术,能够在复杂背景下高效提取目标。用户只需在首帧指定目标,后续帧将自动稳定抠图,具备良好的细节还原和时序一致性,适用于多种视频处理场景。

CVPR 2025|视频抠图MatAnyone来了,一次指定全程追踪,发丝级还原

机器之心
机器之心 · 2025-04-17T12:37:23Z

本研究提出了RelightVid框架,旨在解决视频重光照中配对数据集不足和高保真度输出的需求。该框架灵活适应多种重光照条件,实现高时序一致性的重光照效果。

RelightVid: A Temporal Consistent Diffusion Model for Video Relighting

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-27T00:00:00Z
快手可灵凭什么频繁刷屏?揭秘背后三项重要研究

可灵(KLING)是快手AI团队推出的全球首个可公开体验的真实影像级视频生成大模型,经过多次功能升级,推动行业发展。其开源数据集Koala-36M提升了视频生成质量,并与清华大学合作提出新的视频生成范式Owl-1,展现了更高的时序一致性和逻辑合理性。

快手可灵凭什么频繁刷屏?揭秘背后三项重要研究

机器之心
机器之心 · 2025-01-15T02:57:00Z

本研究提出了一种基于掩膜的运动轨迹框架,能够将静态图像转化为真实视频序列,有效解决了对象运动不准确和不一致的问题。该方法在多对象和高运动场景中展现了优异的时序一致性和文本提示忠实度。

Through-The-Mask: Mask-based Motion Trajectories for Image-to-Video Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-06T00:00:00Z

本研究提出了一种新颖的全端到端口型同步框架LatentSync,基于音频条件的潜在扩散模型,旨在提高时序一致性和口型同步的准确性。

LatentSync: Lip Syncing Based on Audio-Conditioned Latent Diffusion Model

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

本文提出了StereoCrafter-Zero框架,通过噪声重启和迭代优化,显著改善了立体视频生成中的深度感知和时序一致性问题。

StereoCrafter-Zero: Zero-Shot Stereo Video Generation Without Paired Training Data

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-21T00:00:00Z

本研究提出了一种新方法RL-V2V-GAN,旨在解决视频到视频合成中的有限标记数据问题。该方法通过增强学习实现源视频到目标视频的映射,同时保持源视频的风格。实验结果表明,在少样本学习条件下,该方法能够生成时序一致的视频。

Few-Shot Learning Video-to-Video Generative Adversarial Network Based on Policy Gradient

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-28T00:00:00Z

本研究提出了多种视频生成模型,优化了时序一致性和长视频生成能力。新方法如Gen-L-Video和LaVie,利用文本驱动生成高质量长视频,表现优异。同时介绍了OpenVid-1M数据集和Loong模型,解决了生成长视频的挑战,展现出显著的创新性和实用潜力。

LVD-2M:带有时间密集字幕的长视频数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-14T00:00:00Z

本研究提出了多种视频生成模型,优化了时序一致性和音频驱动效果。通过新方法如EMO和Loopy,提升了说话和肖像视频的真实感与表现力,解决了传统技术的局限性,并展示了高效的动态视频风格化和编辑能力,推动了视频生成技术的发展。

Hallo2:长时长和高分辨率音频驱动的人物图像动画

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-10T00:00:00Z

本研究提出了一种名为视频指南的新框架,旨在解决文本到视频生成中的时序一致性问题。该方法利用预训练的视频扩散模型作为引导,显著提高了视频生成的时序质量和图像保真度,具有良好的成本效益和应用潜力。

Video Guide: Improving Video Diffusion Models without Training Through Teacher Guidance

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-06T00:00:00Z
视频人脸修复方案 :无需预对齐的解析引导时序一致性模型 PGTFormer

该论文提出了一种名为PGTFormer的盲视频人脸修复模型,通过语义解析的引导选择最佳的面部先验,生成时序一致且无伪影的结果。该模型无需面部预对齐,能提高视频的时序一致性。在多个定量指标和主观视觉对比实验中,该方法表现优异。

视频人脸修复方案 :无需预对齐的解析引导时序一致性模型 PGTFormer

实时互动网
实时互动网 · 2024-08-30T06:21:56Z

本研究提出了多种视频生成模型,如VideoFactory、MovieFactory和VideoDirectorGPT,旨在优化时序一致性和生成质量。通过利用大语言模型和新框架,这些模型能够生成高质量视频,强调视觉一致性和用户偏好。此外,研究探讨了生成AI在视频技术中的应用潜力,并提出了基准测试集TC-Bench,以评估视频生成模型的改进空间。

梦工厂:基于多智能体框架的多场景长视频生成创新

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-21T00:00:00Z

本研究提出了一种名为VidEdit的零镜头文本视频编辑方法,解决了文本引导视频编辑中的时间不连贯问题,显著提高了视频的时序一致性和编辑能力。该方法在DAVIS数据集上表现优于现有技术,处理速度约为每分钟一段视频。此外,研究还介绍了TI2V-Zero和GenVideo等新方法,进一步提升了视频生成和编辑效果。

Slicedit: 使用时空切片的文本到图像传扩模型的零样本视频编辑

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-05-20T00:00:00Z

本文介绍了一种名为Gen-L-Video的新方法,利用短视频扩散模型生成多样化的长视频,提升视频生成和编辑能力。该方法在多个数据集上验证,性能优于现有技术,用户偏好超过80%。研究还探讨了视频生成模型的时序一致性和高质量生成策略。

长视频生成调查:挑战、方法与前景

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-25T00:00:00Z

本文介绍了一种高效的零样本视频编辑方法EVE,利用深度图和时序一致性约束,快速生成满意的视频编辑结果。同时,提出了Video Instruction Diffusion(VIDiff)模型,支持多种视频任务,并通过迭代自回归方法确保长视频的一致性编辑。研究强调了基于扩散模型的多种视频编辑技术的重要性,特别是时间一致性和高质量生成。

基于分解扩散蒸馏的视频编辑

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-14T00:00:00Z

我们提出了一种新颖的零样条移动物体轨迹控制框架Motion-Zero,通过提供基于位置的先验来改善移动物体的外观稳定性和位置准确性,并利用U-net的注意力图在扩散模型的去噪过程中直接应用空间约束,从而进一步确保移动物体的位置和空间一致性,并通过引入移动注意力机制实现时序一致性的保证。这种方法可以灵活运用于各种最先进的视频扩散模型,无需任何训练过程,大量实验证明我们的方法可以控制物体的运动轨迹并生成高质量的视频。

Motion-Zero:基于扩散的视频生成中的零表示移动物体控制框架

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-18T00:00:00Z

本文介绍了一种基于多视图校准的多人3D姿势估计和跟踪方法,利用时序一致性来匹配先前构建的每个视图中的用2D姿势估计生成的3D骨架,并提出两种策略以实现更好的对应关系和3D重构。该方法在两个基准上取得了竞争性成果,并在Campus测试中取得了良好的结果。

多视角人物匹配与任意非标定相机网络下的三维姿态估计

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-04T00:00:00Z

本文提出了一个新的用于验证视频脸部年龄回溯效果的基线架构,并开发了三个新度量指标。实验证明,该方法在年龄转换和时序一致性方面优于现有方法。

视频面部年龄转换:朝着时间一致的面部年龄转换

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-20T00:00:00Z

该研究使用基于3D nnU-Net的深度学习方法进行医学图像分割,并与传统2D和循环分割方法进行比较。结果表明该方法在时序一致性和跨数据集泛化性方面具有优势,有望成为临床工具的首选。

基于语义感知的时间通道注意力在心脏功能评估中的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-09T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码