我正在使用cifar-10数据集,并且需要公开可用的数据集,因此我将其推送到了gitlab。我想在我的代码中加载这个数据集,在一些挖掘后,我找到了一个使用tf.keras.utils.get_file()的例子,看起来很完美,但是当我尝试加载我的数据集时,我遇到了NotADirectoryError。但是我在网上找到的示例可以正常加载,这让人感到困惑,请问有人能解释一下为什么它对我的数据集不起作用吗?
这是我发现的可以工作的示例,is_dir()返回true。
import pathlib
data_root_orig = tf.keras.utils.get_file(
'flower_photos','https://storage.googleapis.com/download.tensorflow.org/example_images/flower_photos.tgz',untar=True)
data_root = pathlib.Path(data_root_orig)
print(data_root.is_dir()
)
这是我正在尝试加载的数据集。最初会抛出“train_data不是目录”的错误,当我再次尝试时似乎可以工作,但is_dir为false,我无法访问我的数据集中的文件。
import pathlib
import tensorflow as tf
data_root_orig = tf.keras.utils.get_file('train',
'https://gitlab.com/StephenAI/osato-file/raw/master/train.zip',
untar=True, archive_format='zip')
data_root = pathlib.Path(data_root_orig)
print(data_root, type(data_root),data_root.is_dir())