我有这样的一个数据集
my_data= [['Manchester', '23', '80', 'CM',
'Manchester', '22', '79', 'RM',
'Manchester', '19', '76', 'LB'],
['Benfica', '26', '77', 'CF',
'Benfica', '22', '74', 'CDM',
'Benfica', '17', '70', 'RB'],
['Dortmund', '24', '75', 'CM',
'Dortmund', '18', '74', 'AM',
'Dortmund', '16', '69', 'LM']
]
我知道使用sklearn.cross_validation中的train_test_split函数,并已经尝试过以下代码:
from sklearn.model_selection import train_test_split
train, test = train_test_split(my_data, test_size = 0.2)
现有的结果只是将数据分为测试集和训练集,我希望将其分成三个不同的集合,并随机分配数据。
期望结果: 测试集,训练集,验证集
train_test_split
会将你的数据集分成训练集和验证集。不要被名称所迷惑。测试
数据应该是你不知道输出变量的地方。 - Sociopath