本文探讨了基于语言模型的自动图像和视频上色技术,提出了多种提高着色准确性和时间一致性的方法,包括端到端网络、全自动视频着色和基于T2I模型的彩色转换。实验结果表明,这些方法在视觉质量和性能上优于现有技术。
该文介绍了首个端到端网络,用于基于示例的视频着色,并保持参考风格的时间一致性。通过循环框架统一语义对应和颜色传递步骤,利用参考图像来引导每一帧的着色,减少传播误差,并通过时间一致性损失强制协同着色历史。实验结果表明,该方法在定量和定性方面优于现有技术,生成稳定且逼真的视频。
完成下面两步后,将自动完成登录并继续当前操作。