PixelWeb: The First Web GUI Dataset with Pixel-Wise Labels

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

PixelWeb数据集是首个具有像素级标签的网页GUI数据集,解决了自动标注导致的不准确元素边界框问题。该数据集结合视觉特征提取和文档对象模型分析,提供超过100,000个高质量注释网页。实验表明,PixelWeb在GUI元素检测任务中表现优于现有数据集,展示了其潜力。

🎯

关键要点

  • PixelWeb数据集是首个具有像素级标签的网页GUI数据集。
  • 该数据集解决了自动标注导致的不准确元素边界框问题,包括缺失、重复或无意义的区域。
  • PixelWeb采用新颖的自动注释方法,结合视觉特征提取和文档对象模型(DOM)结构分析。
  • 数据集提供了超过100,000个高质量注释网页的像素级标注。
  • 实验结果表明,PixelWeb在GUI元素检测任务中的表现显著优于现有数据集,展示了其潜力。
➡️

继续阅读