计算机视觉数据集 (1)

计算机视觉数据集 (1)

💡 原文英文,约400词,阅读约需2分钟。
📝

内容提要

本文介绍了多个手写数字和字符数据集,包括MNIST、EMNIST、QMNIST、ETLCDB、Kuzushiji和Moving MNIST,涵盖了各数据集的特点、数据量及其在深度学习和图像识别中的应用。

🎯

关键要点

  • MNIST数据集包含70,000个手写数字,每个28x28像素,分为60,000个训练样本和10,000个测试样本。
  • EMNIST数据集扩展了MNIST,包含手写字符,分为6个子数据集,总共814,255个字符。
  • QMNIST数据集包含120,000个手写数字,分为60,000个训练样本和60,000个测试样本。
  • ETLCDB数据集包含手写或机器打印的数字、符号、字母和日文字符,分为9个子数据集。
  • Kuzushiji数据集包含草书风格的日文字符,分为3个子数据集,总共包含70,000个平假名、270,912个字符和140,424个汉字。
  • Moving MNIST数据集包含10,000个视频,每个视频有20帧和2个移动数字。

延伸问答

MNIST数据集的特点是什么?

MNIST数据集包含70,000个手写数字,每个28x28像素,分为60,000个训练样本和10,000个测试样本。

EMNIST数据集与MNIST有什么不同?

EMNIST数据集扩展了MNIST,包含手写字符,分为6个子数据集,总共814,255个字符。

QMNIST数据集的规模和结构是怎样的?

QMNIST数据集包含120,000个手写数字,分为60,000个训练样本和60,000个测试样本。

ETLCDB数据集包含哪些类型的字符?

ETLCDB数据集包含手写或机器打印的数字、符号、字母和日文字符,分为9个子数据集。

Kuzushiji数据集的特点是什么?

Kuzushiji数据集包含草书风格的日文字符,分为3个子数据集,总共包含70,000个平假名、270,912个字符和140,424个汉字。

Moving MNIST数据集的结构是怎样的?

Moving MNIST数据集包含10,000个视频,每个视频有20帧和2个移动数字。

➡️

继续阅读