PhiNet v2:一种无遮罩的类脑视觉基础模型来自视频
📝
内容提要
本研究解决了当前自监督学习在视觉处理上的局限性,提出了一种基于Transformer的PhiNet v2架构,能够处理时间视觉输入而无需强数据增强。实验结果表明,该模型在竞争性能和从连续输入流中学习的能力上均表现出色,为生物启发的计算机视觉系统的进一步发展奠定了基础。
➡️
本研究解决了当前自监督学习在视觉处理上的局限性,提出了一种基于Transformer的PhiNet v2架构,能够处理时间视觉输入而无需强数据增强。实验结果表明,该模型在竞争性能和从连续输入流中学习的能力上均表现出色,为生物启发的计算机视觉系统的进一步发展奠定了基础。