在fastai库中使用download_data()和untar_data()函数

5
我使用 fastai 库中的 download_data() 函数从 Kaggle 上下载了 Fashion MNIST 数据集。 downloaded_data = download_data("https://www.kaggle.com/zalando-research/fashionmnist/download") 输出为: PosixPath('/root/.fastai/data/download.tgz') download_data 将其保存为 .tgz 文件,现在我使用 untar_data() 函数来解压数据集。 path = untar_data('/root/.fastai/data/download.tgz') 输出为: PosixPath('/root/.fastai/data/download.tgz') 该命令并没有解压 .tgz 文件。我如何在 fastai 库中使用这个数据集呢?
1个回答

3
在fastai库中,download_data函数会返回一个pathlib.PosixPath类型的文件路径,而不是实际的数据文件。你需要使用其他解压库来提取数据。
如果你只需要快速获取MNIST数据,可以使用以下简单方法:
from fastai import datasets
import gzip, pickle
MNIST_URL='http://deeplearning.net/data/mnist/mnist.pkl'
path = datasets.download_data(MNIST_URL, ext='.gz')
with gzip.open(path, 'rb') as f:
    ((x_train, y_train), (x_valid, y_valid), _) = pickle.load(f, encoding='latin-1')

path = untar_data(URLs.MNIST) 这个不是更简单吗? - Nihat

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接