我有一个文件列表,想将其分为三个部分:训练、验证和测试。我尝试了这段代码,但不确定它是否正确。
files = glob.glob("/dataset/%s/*" % emotion)
training = files[:int(len(files)*0.8)] #get first 80% of file list
validation = files[-int(len(files)*0.1):] #get middle 10% of file list
testing = files[-int(len(files)*0.1):] #get last 10% of file list
我不确定测试列表是否重复,或者它是否是文件列表的正确后10%。
len(files) == 3
就会导致索引变成(2, 0, 0)
,而不是(2, 1, 0)
或者(2, 0, 1)
。此外,验证和测试数据集应该是不同的,它们相等是不合适的(测试数据集应该是你从未接触过的数据)。 - Graipher