我一直在尝试找到一种加载EMNIST字母数据集的方法,但没有太大的成功。我发现结构中有趣的内容,但是无法理解正在发生的事情。这就是我的意思:
我下载了这里的.mat格式
我可以使用以下方式加载数据
import scipy.io
mat = scipy.io.loadmat('letter_data.mat') # renamed for conveniance
这是一个字典,其键如下:
dict_keys(['__header__', '__version__', '__globals__', 'dataset'])
唯一有意义的关键词是数据集,但我无法从中获取数据。打印它的形状如下:
>>>print(mat['dataset'].shape)
(1, 1)
我深入挖掘,寻找类似于真实数据集的形状,并找到了这个:
>>>print(mat['dataset'][0][0][0][0][0][0].shape)
(124800, 784)
这正是我想要的,但我找不到标签或测试数据,我尝试了许多方法,但似乎无法理解这个数据集的结构。
如果有人能告诉我这是怎么回事,我会非常感激。