我是一个初学者,正在学习pandas和python。我的输入数据如下:
category text
1 hello iam fine. how are you
1 iam good. how are you doing.
inputData= pd.read_csv(Input', sep='\t', names=['category','text'])
X = inputData["text"]
Y = inputData["category"]
这里的Y是熊猫系列对象,我想将其转换为numpy数组。所以我尝试使用.as_matrix方法。
请注意:由于您要求保留HTML标签,因此我在结果中包含了原始HTML标签。YArray= Y.as_matrix(columns=None)
print YArray
但是我得到的输出是 [1,1](这是错误的,因为我只有一个列类别和两行)。我希望结果是一个2x1的矩阵。
.values
方法将被避免使用,取而代之的是两个新方法。请参考这个答案。 - cs95