Python NumPy:更改NumPy矩阵的列类型

12

我有一个numpy矩阵X,我尝试使用以下代码更改第1列的数据类型:

X[:, 1].astype('str')
print(type(X[0, 1]))

但我得到了以下结果:

<type 'numpy.float64'>

有人知道为什么类型没有被更改为字符串吗? 还有,更改X列的类型的正确方法是什么?谢谢!


1
ndarray.astype 不会原地执行。您无法更改数组的一列的类型。如果您想要一个混合类型的数组,应该使用结构化类型 - Syrtis Major
4个回答

7
提供一个简单的例子将更好地解释它。
>>> a = np.array([[1,2,3],[4,5,6]])
array([[1, 2, 3],
       [4, 5, 6]])
>>> a[:,1]
array([2, 5])
>>> a[:,1].astype('str') # This generates copy and then cast.
array(['2', '5'], dtype='<U21')
>>> a                    # So the original array did not change.
array([[1, 2, 3],
       [4, 5, 6]])

13
这解释了为什么它不起作用,但没有解释要怎么做才对。在我的情况下,我有一列字符串(从numpy的角度看是对象类型),以及一个将这些字符串映射到整数的函数,我想使用它来将字符串列转换为整数列。 - Joseph Garvin

3

让我回答第二个问题,因为我遇到了同样的问题。

正如dinarkino所提到的,仅仅将类型赋回去是不起作用的。

>>> X = np.array([[1.1,2.2],[3.3,4.4]])
>>> print(X[:,1].dtype)
<class 'numpy.float64'>

>>> X[:,1] = X[:,1].astype('str')
>>> print(X[:,1].dtype)
<class 'numpy.float64'>

所以我的方法是首先将整个矩阵的数据类型分配为“object”,然后再分配回字符串数据类型。

>>> X = X.astype('object')
>>> print(type(X[0,1]))
<class 'float'>

>>> X[:,1] = X[:,1].astype('str')
>>> print(type(X[0,1]))
<class 'str'>

1
这是问题的预期答案。 - subin sahayam

1
更加清晰明了的答案。类型没有改为str,因为NumPy数组应该只有一种数据类型。更改X列类型的正确方法是使用结构化数组或从此问题中选择解决方案之一。
我遇到了同样的问题,而且我不想使用结构化数组。如果适合您的任务,可能的选择是使用pandas。如果您只要更改一列,则可能意味着您的数据是表格形式的。然后您可以轻松更改列的数据类型。另一个折衷方案是复制列并将其与原始数组分开使用。
>>> x = np.ones((3, 3), dtype=np.float)
array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])
>>> x[:, 1] = x[:, 1].astype(np.int)
>>> type(x[:, 1][0])
numpy.float64
>>> x_pd = pd.DataFrame(x)
>>> x_pd[1] = x_pd[1].astype(np.int16)
>>> type(x_pd[1][0])
numpy.int16

0
当我面临相同问题时,我使用了这个快速的一行解决方法。
>>> X = np.array([[1,2],[3,4],[5,6]])
    [[1 2]
     [3 4]
     [5 6]]

>>> X_1 = np.array([[x,str(y)] for x,y in X],dtype='O')
   [[1 '2']
    [3 '4']
    [5 '6']]

可能有点过于复杂,但是可以运行。 :)

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接