所以我有两个数据列表,看起来像这样(缩短版):
我想做的是合并它们,将每个数据集的第一个元素相加,如果任何一个计数器值为None,则将其设置为0.0。因此,上面的示例将变为:
这是我到目前为止想出来的,如果有点笨重请原谅。
我只能希望/假设我可以在itertools或collections中找到一些巧妙的方法?
[[1.0, 1403603100],
[0.0, 1403603400],
[2.0, 1403603700],
[0.0, 1403604000],
[None, 1403604300]]
[1.0, 1403603100],
[0.0, 1403603400],
[1.0, 1403603700],
[None, 1403604000],
[5.0, 1403604300]]
我想做的是合并它们,将每个数据集的第一个元素相加,如果任何一个计数器值为None,则将其设置为0.0。因此,上面的示例将变为:
[[2.0, 1403603100],
[0.0, 1403603400],
[3.0, 1403603700],
[0.0, 1403604000],
[0.0, 1403604300]]
这是我到目前为止想出来的,如果有点笨重请原谅。
def emit_datum(datapoints):
for datum in datapoints:
yield datum
def merge_data(data_set1, data_set2):
assert len(data_set1) == len(data_set2)
data_length = len(data_set1)
data_gen1 = emit_datum(data_set1)
data_gen2 = emit_datum(data_set2)
merged_data = []
for _ in range(data_length):
datum1 = data_gen1.next()
datum2 = data_gen2.next()
if datum1[0] is None or datum2[0] is None:
merged_data.append([0.0, datum1[1]])
continue
count = datum1[0] + datum2[0]
merged_data.append([count, datum1[1]])
return merged_data
我只能希望/假设我可以在itertools或collections中找到一些巧妙的方法?
iter
代替emit_datum
。 - Niklas B.