Numpy - 给现有数组分配列数据类型(dtype)

6

I have a given array:

array = [(u'Andrew', -3, 3, 100.032) (u'Bob', -4, 4, 103.323) (u'Joe', -5, 5, 154.324)]

这是从另一个进程(我无法控制)生成的输出numpy数组,其源数据为CSV表格。现在,我需要分配列的数据类型以进行进一步的分析。

我应该怎么做呢?

谢谢。


这个问题是什么意思-1? - code base 5000
2个回答

8
这是您需要的吗?
new_array = np.array(array, dtype = [("name", object), 
                                     ("N1", int), 
                                     ("N2", int),
                                     ("N3", float)])

其中name和N1-3是我指定的列名。

它会给出:

array([(u'Andrew', -3, 3, 100.032), (u'Bob', -4, 4, 103.323),
       (u'Joe', -5, 5, 154.324)], 
      dtype=[('name', 'O'), ('N1', '<i8'), ('N2', '<i8'), ('N3', '<f8')])

你可以按照"N1"进行排序:
new_array.sort(order="N1")
new_array
array([(u'Joe', -5, 5, 154.324), (u'Bob', -4, 4, 103.323),
       (u'Andrew', -3, 3, 100.032)], 
      dtype=[('name', 'O'), ('N1', '<i8'), ('N2', '<i8'), ('N3', '<f8')])

希望这可以帮到你。

3
recarr = np.rec.fromrecords(array)

可选地设置字段名称:

recarr = np.rec.fromrecords(array, names="name, idata, idata2, fdata")

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接