是否有一种高效的算法可以在CUDA中尽可能快地比较两个2D数组?结果我需要相等的数组字段数量。
提前感谢任何帮助!
是否有一种高效的算法可以在CUDA中尽可能快地比较两个2D数组?结果我需要相等的数组字段数量。
提前感谢任何帮助!
a == b
的总和。您应该查找关于CUDA reduction实现的文章。两个相关的操作可能会有用,分别是thrust::transform用于构造布尔数组和thrust::count_if用于进行规约。还可以使用带有高级迭代器等更有效的技术。浏览一下教程。
thrust::equal
https://thrust.github.io/doc/group__comparisons_gad90af5f86ba9092cd92c0ae4ebd8d677.html。(大部分工作将是将2D结构适应为类似于thrust可以接受的形式。) - alfC