PixelWeb数据集是首个具有像素级标签的网页GUI数据集,解决了自动标注导致的不准确元素边界框问题。该数据集结合视觉特征提取和文档对象模型分析,提供超过100,000个高质量注释网页。实验表明,PixelWeb在GUI元素检测任务中表现优于现有数据集,展示了其潜力。
本研究提出LA$^3$框架,解决生物研究中高质量注释不足的问题,通过大型语言模型增强数据集LaChEBI-20,显著提升分子生成和注释任务的模型性能,最高提升达301%。
本研究解决了复杂事件中理解和评估驱动目标行为的挑战,通过参与者成就的视角获取知识并收集了6330条高质量的目标和行动注释,证明该方法有效。研究发现,经过数据集微调的小型模型表现优于大型模型。
完成下面两步后,将自动完成登录并继续当前操作。