PixelWeb:首个具有像素级标签的网页GUI数据集

本文解决了现有GUI数据集中自动标注造成的不准确元素边界框(BBox)标注问题,包括缺失、重复或无意义的区域。研究提出的PixelWeb数据集采用新颖的自动注释方法,结合视觉特征提取和文档对象模型(DOM)结构分析,提供了超过100,000个注释网页的高质量像素级标注。实验结果表明,PixelWeb在GUI元素检测任务中的表现显著优于现有数据集,展示了其在后续任务中的潜力。

本文提出了PixelWeb数据集,解决了现有GUI数据集中元素边界框标注不准确的问题。该数据集通过视觉特征提取和DOM结构分析,提供了超过10万个高质量像素级标注,实验结果表明其在GUI元素检测任务中表现优异。

原文中文,约300字,阅读约需1分钟。发表于:
阅读原文