本研究旨在探讨自监督学习技术在相同程度和数量的感官输入下,是否能够达到人类水平的视觉图像理解。研究结果表明,在增加数据量和提高图像质量的情况下进行规模化实验,可以实现人类水平的物品检测性能。实验使用了最多200,000张分辨率为256像素每英寸的图像。
完成下面两步后,将自动完成登录并继续当前操作。