小红花·文摘

本研究旨在探讨自监督学习技术在相同程度和数量的感官输入下，是否能够达到人类水平的视觉图像理解。研究结果表明，在增加数据量和提高图像质量的情况下进行规模化实验，可以实现人类水平的物品检测性能。实验使用了最多200,000张分辨率为256像素每英寸的图像。