字典的笛卡尔积

Question

字典的笛卡尔积

3

我正在编写一些Python代码，以获得以下输出，即所有排列组合。 region和gender的值是概率，result反映了给定事件组合的乘积。

看起来可以通过使用itertools和apply来实现，但我对具体实现还不太确定。

输入：

region = {'east': 0.5, 'north': 0.20, 'south': 0.10, 'west': 0.20}
gender = {'female': 0.70, 'male': 0.30}

期望输出：

result = {('east','female'):0.35, 
('east','male'):0.15,
('north','female'):0.14,
('north','male'):0.06,
('south','female'):0.07,
('south','male'):0.03,
('west','female'):0.14,
('west','male'):0.06}

- GabrielChu

与此有关的话题：https://dev59.com/yp3ha4cB1Zd3GeqPV4ce - Karl Knechtel

2个回答

3

如果想要使用itertools，你可以这样做:

from itertools import product

d = {(reg[0], gen[0]): reg[1]*gen[1]
     for (reg, gen) in product(region.items(), gender.items())}

尽管我强烈倾向于Willem Van Onsem的答案，但如果您没有将所有结果存储在字典中，而只是迭代它们、对结果进行处理并丢弃它们，那么使用itertools版本可能会更有益。例如：

for (reg, gen) in product(region.items(), gender.items()):
    key = (reg[0], gen[0])
    value = reg[1]*gen[1]
    # do something with key, value

- hiro protagonist

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Willem Van Onsem · Accepted Answer

两个字典

可以使用嵌套循环的 字典推导式：

{(k1,k2):v1*v2 for k1,v1 in region.items() for k2,v2 in gender.items()}

因此我们为每个region中的k1,v1和每个gender中的k2,v2构造一个字典元素，其键为(k1,k2)，映射到v1*v2。

这样生成：

>>> {(k1,k2):v1*v2 for k1,v1 in region.items() for k2,v2 in gender.items()}
{('north', 'female'): 0.13999999999999999, ('west', 'female'): 0.13999999999999999, ('east', 'female'): 0.35, ('south', 'male'): 0.03, ('north', 'male'): 0.06, ('east', 'male'): 0.15, ('south', 'female'): 0.06999999999999999, ('west', 'male'): 0.06}

你看到的是0.13999...而不是0.14，这是由于浮点数的四舍五入误差导致的，与字典理解本身无关。

任意数量的字典

也可能出现您想要计算任意数量的字典的笛卡尔积的情况（请注意，由于内存限制，这将呈指数增长，因此字典数量肯定受限）。在这种情况下，您可以使用以下过程:

from operator import mul, getitem
from functools import reduce
from itertools import product, starmap

def cartesian_dictionary(*args,fold=mul):
    return { ks : reduce(fold,starmap(getitem,zip(args,ks)))
                  for ks in product(*args) }

导致：

>>> cartesian_dictionary({'east': 0.5, 'north': 0.20, 'south': 0.10, 'west': 0.20},{'female': 0.70, 'male': 0.30})
{('east', 'female'): 0.35, ('west', 'female'): 0.13999999999999999, ('south', 'male'): 0.03, ('north', 'male'): 0.06, ('south', 'female'): 0.06999999999999999, ('north', 'female'): 0.13999999999999999, ('west', 'male'): 0.06, ('east', 'male'): 0.15}

但它提供了额外的灵活性：

three or more dictionaries, like:

>>> cartesian_dictionary({'a':2,'b':3},{'c':0.5,'d':1},{'e':1,'f':2})
{('b', 'c', 'e'): 1.5, ('a', 'c', 'f'): 2.0, ('b', 'd', 'f'): 6, ('a', 'c', 'e'): 1.0, ('b', 'd', 'e'): 3, ('a', 'd', 'f'): 4, ('b', 'c', 'f'): 3.0, ('a', 'd', 'e'): 2}

other way to "fold" values:

>>> cartesian_dictionary({'a':2,'b':3},{'c':0.5,'d':1},fold=operator.add)
{('a', 'd'): 3, ('b', 'd'): 4, ('b', 'c'): 3.5, ('a', 'c'): 2.5}