在一行中求元素之和(Python/Numpy)

3

我正在一个自由选择使用什么的项目上工作。所以我决定学习Python。

简而言之,我想要对我读入的矩阵中的“行”中的所有元素求和。

这是我从文本文件中读入表格后得到的2D数组的样子。

['0000' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '0' '1']
['0001' '0' '1' '0' '1' '0' '0' '0' '0' '1' '0' '0' '0' '0' '1']
['0010' '0' '1' '0' '1' '0' '0' '0' '0' '1' '0' '0' '0' '0' '1']
['0011' '0' '1' '0' '1' '0' '0' '0' '0' '1' '0' '0' '0' '0' '1']
['0100' '0' '0' '0' '0' '0' '1' '0' '1' '0' '0' '1' '0' '0' '1']
['0101' '0' '0' '1' '0' '0' '0' '1' '0' '0' '1' '0' '1' '1' '0']
['0110' '0' '0' '1' '0' '1' '0' '0' '0' '0' '1' '0' '1' '1' '0']
['0111' '0' '0' '1' '0' '0' '0' '0' '0' '0' '1' '0' '0' '1' '0']
['1000' '0' '0' '0' '0' '0' '1' '0' '1' '0' '0' '1' '0' '0' '1']
['1001' '1' '0' '0' '0' '0' '0' '1' '0' '0' '1' '0' '1' '1' '0']
['1010' '1' '0' '0' '0' '1' '0' '0' '0' '0' '1' '0' '1' '1' '0']
['1011' '1' '0' '0' '0' '0' '0' '0' '0' '0' '1' '0' '0' '1' '0']
['1100' '0' '0' '0' '0' '0' '1' '0' '1' '0' '0' '1' '0' '0' '1']
['1101' '0' '0' '0' '0' '0' '0' '1' '0' '0' '0' '0' '1' '1' '0']
['1110' '0' '0' '0' '0' '1' '0' '0' '0' '0' '0' '0' '1' '1' '0']
['1111' '0' '0' '0' '0' '0' '0' '0' '0' '0' '1' '0' '1' '1' '0']

我希望能够将每一行(不包括索引0,即4位数字)的所有元素相加,并将这些总和存储在一个列表中。下面是我期望得到的总和列表:
[1, 4, 4, 4, 4, 4, 5, 5, 3,.......,3] (Imagine it was all filled with the right sums)

然而,这是我的代码输出的内容:
number of rows: 16
number of cols: 15
num1s before: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
num1s after : [3, 3, 3, 3, 3, 3, 3, 3, 3, 7, 3, 7, 9, 7]

我不确定错误是什么,但我认为它与字符串/整数转换有关。由于我的表格是用字符串表示的,但我将其转换为整数进行求和。调试显示正确的结果,因此我不确定错误在哪里。

这是我的代码:

import numpy

print ("Reading..")
txtfile = open("test1.txt", "r")
print(txtfile.readline())
txtfile.close()

r= numpy.genfromtxt('test1.txt',dtype=str,skiprows=1)

for x in range (0,len(r)):
    print(r[x])

allTested = [0] * (len(r[0]) - 1)
num1s = [0] * (len(r[0]) - 1)

print("number of rows:", len(r))
print("number of cols:", len(r[0]))
print("num1s before:",num1s)

for x in range (0,len(r)):
    for y in range(1,len(r[0])):
        num1s[y-1] += int(r[x][y])


print("num1s after :",num1s)
2个回答

9

您把它想复杂了,可以尝试以下方法:

np.sum(array,axis=1).tolist()

这应该返回一个列表,其中包含所有行的总和。
例如:
import numpy as np
array = np.array([range(10),range(10),range(10),range(10)])

sum_ = np.sum(array,axis=1).tolist()

print sum_
print type(sum_) 

>> [45, 45, 45, 45]
>> <type 'list'>

哈哈,兄弟,我知道我在Python中一定把很多东西复杂化了。那是一个生成列表的命令吗?也就是说,我不需要嵌套的for循环吗? - KHMB
是的,.tolist() 会生成一个列表,你不需要使用循环。试一下吧。 - farhawa
似乎不起作用。这是我的代码: w = numpy.sum(r,axis=1).tolist()然后打印w。运行时出现“无法使用灵活类型执行缩减”错误。您能否编辑我的代码并向我展示如何实现它?我很可能实现得不正确。 - KHMB
@user4927176 好的,只需将您的数组声明为浮点数数组,如下所示:r= numpy.genfromtxt('test1.txt',dtype=float, skiprows=1) - farhawa
我想将我的数组声明为int类型。但是我希望每行的第一个元素保持原来的大小。如果我使用dtype=int,它会将0000转换为0,将0001转换为1。这不是我想要的。有没有解决方法? - KHMB

2

好的,找到了答案。

@wajid Farhani 的答案接近正确,但在我的情况下不起作用。

他的 np.sum 命令可以使用,但我需要进行一些索引操作,以便忽略每行的索引 0。我的问题是,我认为对 2D 数组进行索引是通过 array[x][y] 完成的,实际上应该是 array[x,y]。

修正后的代码:

import numpy

print ("Reading..")
txtfile = open("test1.txt", "r")
print(txtfile.readline())
txtfile.close()

r= numpy.genfromtxt('test1.txt',dtype=str,skiprows=1)

for x in range (0,len(r)):
    print(r[x])

allTested = [0] * (len(r[0]) - 1)
num1s = [0] * (len(r))

print("number of rows:", len(r))
print("number of cols:", len(r[0]))
print("num1s before:",num1s)

array = numpy.array(r,dtype=int)

s = numpy.sum(array[0:len(array),1:len(array[0])],axis=1).tolist()

print("num1s after :",s)

正确的输出:

num1s before: [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
num1s after : [1, 4, 4, 4, 4, 5, 5, 3, 4, 5, 5, 3, 4, 3, 3, 3]

很高兴我的回答对你有帮助。还有一件事,它是“wajdi”,不是“wajid” :) - farhawa
你正在过度复杂化数组索引s = numpy.sum(array[:, 1:], axis=1).tolist()可以达到同样的效果。 - Imanol Luengo

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接