UrbanVLP:城市指标预测的多粒度视觉语言预训练基础模型
原文中文,约300字,阅读约需1分钟。发表于: 。我们在本文中提出了一种新颖的视觉 - 语言预训练模型(UrbanVLP),该模型能够无缝地整合来自宏观(卫星)和微观(街景)层面的多粒度信息,克服了先前预训练模型的局限性,提高了城市规划中的可解释性。我们的 UrbanVLP 模型还引入了自动生成文字描述和校准,通过生成高质量的城市图像描述,提升了在下游应用中的可解释性。大量的实验验证了 UrbanVLP...
本文介绍了UrbanVLP模型,一种新颖的视觉-语言预训练模型,能提高城市规划的可解释性。UrbanVLP整合了宏观和微观层面的信息,并通过生成高质量的城市图像描述来提升可解释性。实验证明UrbanVLP在六个社会经济任务上表现出卓越性能,并通过网络平台验证了其实用性。