如何使用Java 8流创建笛卡尔积?

49

我有以下集合类型:

Map<String, Collection<String>> map;

我想要创建每个键中map.size()个独特组合,每个组合来自集合中的单个值。

例如,假设地图如下所示:

A, {a1, a2, a3, ..., an}
B, {b1, b2, b3, ..., bn}
C, {c1, c2, c3, ..., cn}

我想要得到的结果是一个List<Set<String>>,看起来类似于以下内容(顺序不重要,它只需要是一个“完整”的结果,包含所有可能的组合):

{a1, b1, c1},
{a1, b1, c2},
{a1, b1, c3},
{a1, b2, c1},
{a1, b2, c2},
{a1, b2, c3},
...
{a2, b1, c1},
{a2, b1, c2},
...
{a3, b1, c1},
{a3, b1, c2},
...
{an, bn, cn}

这基本上是一个计数问题,但我想看看是否可以使用Java 8流实现解决方案。

11个回答

20
你可以使用递归的flatMap链来解决这个问题。
首先,由于我们需要在映射值之间来回移动,最好将它们复制到ArrayList中(这不是深度复制,在你的情况下,ArrayList只有3个元素,因此额外的内存使用很低)。
其次,为了维护先前访问的元素的前缀,让我们创建一个帮助不可变的Prefix类:
private static class Prefix<T> {
    final T value;
    final Prefix<T> parent;

    Prefix(Prefix<T> parent, T value) {
        this.parent = parent;
        this.value = value;
    }

    // put the whole prefix into given collection
    <C extends Collection<T>> C addTo(C collection) {
        if (parent != null)
            parent.addTo(collection);
        collection.add(value);
        return collection;
    }
}

这是一个非常简单的不可变链接列表,可以像这样使用:
```html

这是非常简单的不可变链接列表,可以像这样使用:

```
List<String> list = new Prefix<>(new Prefix<>(new Prefix<>(null, "a"), "b"), "c")
                          .addTo(new ArrayList<>()); // [a, b, c];

接下来,让我们创建一个内部方法来链接 flatMap:
private static <T, C extends Collection<T>> Stream<C> comb(
        List<? extends Collection<T>> values, int offset, Prefix<T> prefix,
        Supplier<C> supplier) {
    if (offset == values.size() - 1)
        return values.get(offset).stream()
                     .map(e -> new Prefix<>(prefix, e).addTo(supplier.get()));
    return values.get(offset).stream()
            .flatMap(e -> comb(values, offset + 1, new Prefix<>(prefix, e), supplier));
}

看起来像是递归,但更加复杂:它不直接调用自身,而是传递了一个调用外部方法的lambda表达式。参数:

  • values:原始值的List(在您的情况下是new ArrayList<>(map.values))。
  • offset:此列表中的当前偏移量。
  • prefix:长度为偏移量的当前前缀(如果offset == 0则为null)。它包含从集合list.get(0)list.get(1)list.get(offset-1)中当前选择的元素。
  • supplier:创建结果集合的工厂方法。

当我们到达值列表的末尾(offset == values.size() - 1)时,我们将最后一个集合中的元素从值映射到使用供应商生成的最终组合。否则,我们使用flatMap,对于每个中间元素扩大前缀并再次调用下一个偏移量的comb方法。

最后,这里是使用此功能的公共方法:

public static <T, C extends Collection<T>> Stream<C> ofCombinations(
        Collection<? extends Collection<T>> values, Supplier<C> supplier) {
    if (values.isEmpty())
        return Stream.empty();
    return comb(new ArrayList<>(values), 0, null, supplier);
}

一个使用示例:
Map<String, Collection<String>> map = new LinkedHashMap<>(); // to preserve the order
map.put("A", Arrays.asList("a1", "a2", "a3", "a4"));
map.put("B", Arrays.asList("b1", "b2", "b3"));
map.put("C", Arrays.asList("c1", "c2"));

ofCombinations(map.values(), LinkedHashSet::new).forEach(System.out::println);

我们将个人组合再次收集到LinkedHashSet中以保留顺序。您可以使用任何其他集合(例如ArrayList::new)。

14

使用Java 8中的forEach实现笛卡尔积:

List<String> listA = Arrays.asList("0", "1");
List<String> listB = Arrays.asList("a", "b");

List<String> cartesianProduct = new ArrayList<>();
listA.forEach(a -> listB.forEach(b -> cartesianProduct.add(a + b)));

System.out.println(cartesianProduct);
// Output: [0a, 0b, 1a, 1b]

13

如果你只想得到两个集合元素的笛卡尔积,这里有一个更简单的解法。

以下代码使用 flatMap 生成两个短列表的笛卡尔积:

public static void main(String[] args) {
    List<Integer> aList = Arrays.asList(1, 2, 3);
    List<Integer> bList = Arrays.asList(4, 5, 6);

    Stream<List<Integer>> product = aList.stream().flatMap(a ->
            bList.stream().flatMap(b ->
                    Stream.of(Arrays.asList(a, b))));

    product.forEach(p -> { System.out.println(p); });

    // prints:
    // [1, 4]
    // [1, 5]
    // [1, 6]
    // [2, 4]
    // [2, 5]
    // [2, 6]
    // [3, 4]
    // [3, 5]
    // [3, 6]
}

如果你想添加更多的集合,只需将流巢入得更深一些:

aList.stream().flatMap(a ->
    bList.stream().flatMap(b ->
        cList.stream().flatMap(c ->
            Stream.of(Arrays.asList(a, b, c)))));

11

这种解决方案主要作用于列表,使得事情变得更简单了。它在flatMap中进行递归调用,跟踪已经组合的元素和尚未组合的元素集合,并将这个嵌套递归构造的结果作为一个列表流呈现:

import java.util.*;
import java.util.stream.Stream;

public class CartesianProduct {
    public static void main(String[] args) {
        Map<String, Collection<String>> map =
                new LinkedHashMap<String, Collection<String>>();
        map.put("A", Arrays.asList("a1", "a2", "a3", "a4"));
        map.put("B", Arrays.asList("b1", "b2", "b3"));
        map.put("C", Arrays.asList("c1", "c2"));
        ofCombinations(map.values()).forEach(System.out::println);
    }

    public static <T> Stream<List<T>> ofCombinations(
            Collection<? extends Collection<T>> collections) {
        return ofCombinations(
                new ArrayList<Collection<T>>(collections),
                Collections.emptyList());
    }

    private static <T> Stream<List<T>> ofCombinations(
            List<? extends Collection<T>> collections, List<T> current) {
        return collections.isEmpty() ? Stream.of(current) :
                collections.get(0).stream().flatMap(e -> {
                    List<T> list = new ArrayList<T>(current);
                    list.add(e);
                    return ofCombinations(
                            collections.subList(1, collections.size()), list);
                });
    }
}

10
虽然它不是流解决方案,但 Guava 的 com.google.common.collect.Sets 可以为您完成这项工作。
Set<List<String>> result = Sets.cartesianProduct(
        Set.of("a1", "a2"), Set.of("b1", "b2"), Set.of("c1", "c2"));

5
这里有另一个解决方案,它没有像Tagir的例子那样使用很多Streams功能;然而,我认为这更加直观易懂:
public class Permutations {
    transient List<Collection<String>> perms;
    public List<Collection<String>> list(Map<String, Collection<String>> map) {
        SortedMap<String, Collection<String>> sortedMap = new TreeMap<>();
        sortedMap.putAll(map);
        sortedMap.values().forEach((v) -> perms = expand(perms, v));
        return perms;
    }

    private List<Collection<String>> expand(
            List<Collection<String>> list, Collection<String> elements) {
        List<Collection<String>> newList = new LinkedList<>();
        if (list == null) {
            elements.forEach((e) -> {
                SortedSet<String> set = new TreeSet<>();
                set.add(e);
                newList.add(set);
            });
        } else {
            list.forEach((set) ->
                    elements.forEach((e) -> {
                        SortedSet<String> newSet = new TreeSet<>();
                        newSet.addAll(set);
                        newSet.add(e);
                        newList.add(newSet);
                    }));
        }
        return newList;
    }
}

如果您对元素的顺序不感兴趣,可以删除Sorted前缀;但是,我认为如果所有内容都已排序,那么调试会更容易。

用法:

Permutations p = new Permutations();
List<Collection<String>> plist = p.list(map);
plist.forEach((s) -> System.out.println(s));

享受吧!


3
请注意,您的解决方案实际上没有使用任何 Stream API 功能(Collection.forEach 不是 Stream API 的一部分)。您可以用传统的 for-in 循环替换 .forEach,这样您的代码就能兼容 Java 5。此外,请注意您将所有组合都存储在内存中。虽然对于 OP 来说这似乎没问题,但如果输入更大,这可能会成为问题。最后,没有简单的方法来并行化它。 - Tagir Valeev

2

嵌套循环的地图和减少方法

一个外部流可以轻松地转换为parallel,在某些情况下可以减少计算时间。内部迭代使用循环实现。

在线尝试!

/**
 * @param map a map of lists
 * @param <T> the type of the elements
 * @return the Cartesian product of map values
 */
public static <T> List<List<T>> cartesianProduct(Map<T, List<T>> map) {
    // check if incoming data is not null
    if (map == null) return Collections.emptyList();
    return map.values().stream().parallel()
            // non-null and non-empty lists
            .filter(list -> list != null && list.size() > 0)
            // represent each list element as a singleton list
            .map(list -> {
                List<List<T>> nList = new ArrayList<>(list.size());
                for (T e : list) nList.add(Collections.singletonList(e));
                return nList;
            })
            // summation of pairs of inner lists
            .reduce((list1, list2) -> {
                // number of combinations
                int size = list1.size() * list2.size();
                // list of combinations
                List<List<T>> list = new ArrayList<>(size);
                for (List<T> inner1 : list1)
                    for (List<T> inner2 : list2) {
                        List<T> inner = new ArrayList<>();
                        inner.addAll(inner1);
                        inner.addAll(inner2);
                        list.add(inner);
                    }
                return list;
            }).orElse(Collections.emptyList());
}

public static void main(String[] args) {
    Map<String, List<String>> map = new LinkedHashMap<>();
    map.put("A", Arrays.asList("A1", "A2", "A3", "A4"));
    map.put("B", Arrays.asList("B1", "B2", "B3"));
    map.put("C", Arrays.asList("C1", "C2"));

    List<List<String>> cp = cartesianProduct(map);
    // column-wise output
    int rows = 6;
    for (int i = 0; i < rows; i++) {
        for (int j = 0; j < cp.size(); j++)
            System.out.print(j % rows == i ? cp.get(j) + " " : "");
        System.out.println();
    }
}

输出:

[A1, B1, C1] [A2, B1, C1] [A3, B1, C1] [A4, B1, C1] 
[A1, B1, C2] [A2, B1, C2] [A3, B1, C2] [A4, B1, C2] 
[A1, B2, C1] [A2, B2, C1] [A3, B2, C1] [A4, B2, C1] 
[A1, B2, C2] [A2, B2, C2] [A3, B2, C2] [A4, B2, C2] 
[A1, B3, C1] [A2, B3, C1] [A3, B3, C1] [A4, B3, C1] 
[A1, B3, C2] [A2, B3, C2] [A3, B3, C2] [A4, B3, C2] 

另请参阅:如何从多个列表中获取笛卡尔积?


0
我写了一个实现Iterable接口的类,只在内存中保存当前项。如果需要,IterableIterator都可以转换为Stream
class CartesianProduct<T> implements Iterable<List<T>> {
  private final Iterable<? extends Iterable<T>> factors;

  public CartesianProduct(final Iterable<? extends Iterable<T>> factors) {
    this.factors = factors;
  }

  @Override
  public Iterator<List<T>> iterator() {
    return new CartesianProductIterator<>(factors);
  }
}

class CartesianProductIterator<T> implements Iterator<List<T>> {
  private final List<Iterable<T>> factors;
  private final Stack<Iterator<T>> iterators;
  private final Stack<T> current;
  private List<T> next;
  private int index = 0;

  private void computeNext() {
    while (true) {
      if (iterators.get(index).hasNext()) {
        current.add(iterators.get(index).next());
        if (index == factors.size() - 1) {
          next = new ArrayList<>(current);
          current.pop();
          return;
        }
        index++;
        iterators.add(factors.get(index).iterator());
      } else {
        index--;
        if (index < 0) {
          return;
        }
        iterators.pop();
        current.pop();
      }
    }
  }

  public CartesianProductIterator(final Iterable<? extends Iterable<T>> factors) {
    this.factors = StreamSupport.stream(factors.spliterator(), false)
          .collect(Collectors.toList());
    iterators = new Stack<>();
    current = new Stack<>();
    if (this.factors.size() == 0) {
      index = -1;
    } else {
      iterators.add(this.factors.get(0).iterator());
      computeNext();
    }
  }

  @Override
  public boolean hasNext() {
    if (next == null && index >= 0) {
      computeNext();
    }
    return next != null;
  }

  @Override
  public List<T> next() {
    if (!hasNext()) {
      throw new IllegalStateException();
    }
    var result = next;
    next = null;
    return result;
  }
}

0
使用一个消费者函数类,一个 List<T> 和一个 foreach。
public void tester() {
    String[] strs1 = {"2", "4", "9"};
    String[] strs2 = {"9", "0", "5"};

    //Final output is {"29", "49, 99", "20", "40", "90", "25", "45", "95"}
    List<String> result = new ArrayList<>();
    Consumer<String> consumer = (String str) -> result.addAll(
            Arrays.stream(strs1).map(s -> s + str).collect(Collectors.toList()));
    Arrays.stream(strs2).forEach(consumer);

    System.out.println(result);
}

0
在循环中创建组合列表。
List<String> cartesianProduct(List<List<String>> wordLists) {
    List<String> cp = wordLists.get(0);
    for (int i = 1; i < wordLists.size(); i++) {
        List<String> secondList = wordLists.get(i);
        List<String> combinedList = cp.stream()
                .flatMap(s1 -> secondList.stream()
                        .map(s2 -> s1 + s2))
                .collect(Collectors.toList());
        cp = combinedList;
    }
    return cp;
}

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接