大规模数据集下的实例引导卡通编辑
原文中文,约200字,阅读约需1分钟。发表于: 。本研究介绍了一个高质量的 100k 对高分辨率卡通图像及其实例标签掩膜的数据集,并提出了一个针对卡通图像中角色的准确、高分辨率的分割掩膜生成模型。该方法支持一系列基于分割的卡通编辑应用,如 3D Ken Burns 视差效果、文本引导的卡通风格编辑,以及从插图和漫画中创建木偶动画。
该研究提出了一种新的部分监督训练范式和权重转移函数,使用Visual Genome数据集和COCO数据集训练出可以检测和分割3000个视觉概念的Mask R-CNN模型。这是实现目标实例分割模型的第一步。