AerialBooth:单幅图像文本控制的航拍视图综合中的互信息导向
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
通过预训练的文本到2D图像稳定扩散模型和微调优化的UNet模型,AerialBooth实现了视角和保真度的最佳权衡。
🎯
关键要点
- AerialBooth通过预训练的文本到2D图像稳定扩散模型实现空中视图合成。
- 使用微调优化的UNet模型重建输入图像及其逆透视映射。
- 在推理中利用互信息指导生成图像内容与输入图像的关联。
- 通过7个度量指标分析,AerialBooth实现了视角和保真度的最佳权衡。
➡️