我有一个名为features
的pandas系列,其包含以下数值 (features.values
)。
I have a pandas series features
that has the following values (features.values
)
array([array([0, 0, 0, ..., 0, 0, 0]), array([0, 0, 0, ..., 0, 0, 0]),
array([0, 0, 0, ..., 0, 0, 0]), ...,
array([0, 0, 0, ..., 0, 0, 0]), array([0, 0, 0, ..., 0, 0, 0]),
array([0, 0, 0, ..., 0, 0, 0])], dtype=object)
现在我真的希望这被认为是矩阵,但如果我这样做
>>> features.values.shape
(10000,)
我希望得到的是(10000, 3000)
这样的二维数组,而不是一维数组里嵌套数组的格式。为什么它没有自动识别为二维数组呢?
np.stack(features)
,它将数组视为一组数组,并在新轴上连接它们。在这种情况下,np.vstack(features)
也可以使用。前提是所有内部数组的形状都相同。 - hpauljpandas
数据框架,而不是numpy数组。 - hpauljnp.stack
表现很棒。只是真的不明白为什么features.values
不会将其返回,或者为什么 numpy 不将其识别为 2d 数组。谢谢! - Nate Stemen