我将尝试将我的数据点的numpy数组分成测试集和训练集。为了实现这一目标,我从数组中随机选择行作为训练集,其余部分是测试集。
以下是我的代码:
但是我得到的输出是:
以下是我的代码:
matrix = numpy.loadtxt("matrix_vals.data", delimiter=',', dtype=float)
matrix_rows, matrix_cols = matrix.shape
# training set
randvals = numpy.random.randint(matrix_rows, size=50)
train = matrix[randvals,:]
test = numpy.delete(matrix, randvals, 0)
print matrix.shape
print train.shape
print test.shape
但是我得到的输出是:
matrix.shape: (130, 14)
train.shape: (50, 14)
test.shape: (89, 14)
这显然是错误的,因为训练集和测试集的行数应该加起来等于矩阵中的总行数,但这里明显更多。有人能帮我弄清楚出了什么问题吗?