PixelWeb: The First Web GUI Dataset with Pixel-Wise Labels
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
PixelWeb数据集是首个具有像素级标签的网页GUI数据集,解决了自动标注导致的不准确元素边界框问题。该数据集结合视觉特征提取和文档对象模型分析,提供超过100,000个高质量注释网页。实验表明,PixelWeb在GUI元素检测任务中表现优于现有数据集,展示了其潜力。
🎯
关键要点
- PixelWeb数据集是首个具有像素级标签的网页GUI数据集。
- 该数据集解决了自动标注导致的不准确元素边界框问题,包括缺失、重复或无意义的区域。
- PixelWeb采用新颖的自动注释方法,结合视觉特征提取和文档对象模型(DOM)结构分析。
- 数据集提供了超过100,000个高质量注释网页的像素级标注。
- 实验结果表明,PixelWeb在GUI元素检测任务中的表现显著优于现有数据集,展示了其潜力。
➡️