通过利用音频场景语义实现自动图像着色
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本文提出了一种新颖的自动图像上色网络(AIAIC),通过利用音频的额外语义信息,实现音频引导的上色。实验表明音频引导能够有效改善自动着色的性能。
🎯
关键要点
- 提出了一种新颖的自动图像上色网络(AIAIC)。
- AIAIC利用音频的额外语义信息实现音频引导的上色。
- 网络由三个阶段组成:预训练、学习音频与视觉场景的颜色语义相关性、利用隐式音频语义表示。
- 实验表明音频引导能够有效改善自动着色的性能。
- 音频引导特别对那些仅从视觉模态理解困难的场景有显著改善。
➡️