我想在PyTorch和Torchvision中加载MNIST数据集,并将其分为训练集、验证集和测试集。目前,我已经有了以下代码:
def load_dataset():
train_loader = torch.utils.data.DataLoader(
torchvision.datasets.MNIST(
'/data/', train=True, download=True,
transform=torchvision.transforms.Compose([
torchvision.transforms.ToTensor()])),
batch_size=batch_size_train, shuffle=True)
test_loader = torch.utils.data.DataLoader(
torchvision.datasets.MNIST(
'/data/', train=False, download=True,
transform=torchvision.transforms.Compose([
torchvision.transforms.ToTensor()])),
batch_size=batch_size_test, shuffle=True)
如果我的训练数据集在 DataLoader
中,我该如何将其分成训练和验证集?我想将训练数据集的最后10000个样本作为验证数据集(我知道为了获得更准确的结果应该进行交叉验证,但这里我只想快速验证)。