并行流

Question

并行流

3

有一个函数，可以在并行计算中计算出最常见的名字(Human[] people)。但是会存在数据竞争问题。为什么呢？

    Map<String, Integer> nameMap = new ConcurrentHashMap<>();
        Arrays.stream(people)
                .parallel()
                .filter(p -> p.isAdult())
                .map(Human::getName)
                .forEach(p -> nameMap.put(p, nameMap.containsKey(p) ? nameMap.get(p) + 1 : 1));
        return nameMap.entrySet().parallelStream().max((entry1, entry2) -> entry1.getValue() > entry2.getValue() ? 1 : -1).get().getKey();

- KateS

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Eugene · Accepted Answer

因为你进行的是get操作，然后是递增操作，再接着是put操作；在这之间，有可能已经有人将该条目放入nameMap中了。

在此处，你可以使用原子的ConcurrentHashMap#merge或更好地使用Collectors.toConcurrentMap。编辑你可能可以更加清晰地表达它：

  Arrays.stream(people)
        .parallel()
        .filter(Human::isAdult)
        .collect(Collectors.groupingBy(Human::getName, Collectors.counting()))
        .entrySet()
        .stream()
        .max(Comparator.comparing(Entry::getValue))
        .map(Entry::getKey)
        .get();

请注意，我相信你根本不需要使用parallel。