在GPU上的并行凸包算法

Question

4

我正在使用CUDA实现凸包的分治方法。这是我的方法：自底向上：

但是这变得太复杂了，我感觉没有充分利用CUDA的并行能力，因为在树的每个级别上，我都会创建N/2^i个线程，其复杂度为O(N)，用于在该级别合并所有相邻的凸壳。因此，网络复杂度仍为O(N logN)。

你能告诉我如何改进它或提供任何替代的更好的并行凸包算法吗（如果我能获得Graham扫描的并行版本的算法将会很棒）？

- alpha_cod

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Sergey Bankevich · Accepted Answer

你的算法复杂度仍然是O(N)（与单线程版本相比没有改变），因为你做了三件事：

但如果你的点没有排序，最好并行化排序。