也许这是一个非常模糊的问题,但是在numpy上挖掘链接并没有帮助我。
我需要对类似于这样的二进制数组执行以下分层聚类的相似性矩阵计算。
我需要对类似于这样的二进制数组执行以下分层聚类的相似性矩阵计算。
name val1 val2 val3 val4 val5
comp1 0 0 1 0 1
comp2 1 0 0 0 0
comp3 0 0 1 0 0
comp4 1 1 0 0 0
comp5 0 0 1 0 0
我不理解numpy中行名称的概念。我可以像这样读取文件:
test = np.genfromtxt('test.b', delimiter='\t', names = True, dtype = None)
print type(test[0])
numpy.void
print test[0]
('comp1',0, 0, 1, 0, 1)
但如何考虑行名(这些信息非常重要)?有可能吗?
我认为,用空值来存储二进制数组以进行相似度矩阵计算并不是正确的方法?