从图像到标题:使用卷积神经网络进行视频游戏辨识
原文中文,约600字,阅读约需2分钟。发表于: 。通过使用五种卷积神经网络(MobileNet、DenseNet、EfficientNetB0、EfficientNetB2 和 EfficientNetB3),对 22 种家用游戏主机系统(从 Atari 2600 到 PlayStation 5)的单个截图进行视频游戏识别的研究,确认了 CNN 在截图中提取图像特征的能力,实现了在没有额外特征的情况下从截图中识别游戏标题。利用...
通过研究22种家用游戏主机系统的单个截图,发现CNN在提取图像特征和识别游戏标题方面具有能力。EfficientNetB3表现最佳,平均准确性为74.51%,DenseNet169在14个系统中表现出色。使用替代初始权重提高了EfficientNetB2和EfficientNetB3的准确性,后者达到了最高准确性76.36%。通过优化架构和权重的组合,主要由EfficientNetB3在19个系统中领先,实现了77.67%的准确性。这些发现强调了CNN在视频游戏识别方面的有效性。