C++模板元编程成员函数循环展开

3

我刚开始在我的代码中使用模板元编程。我有一个类,它的成员是一个多维笛卡尔点的向量。以下是该类的基本设置:

template<size_t N>
class TGrid{
public:
     void round_points_3(){
         for(std::size_t i = 0; i < Xp.size();i++){
             Xp[i][0] = min[0] + (std::floor((Xp[i][0] - min[0]) * nbins[0] / (max[0] - min[0])) * bin_w[0]) + bin_w[0]/2.0;
             Xp[i][1] = min[1] + (std::floor((Xp[i][1] - min[1]) * nbins[1] / (max[1] - min[1])) * bin_w[1]) + bin_w[1]/2.0;
             Xp[i][2] = min[2] + (std::floor((Xp[i][2] - min[2]) * nbins[2] / (max[2] - min[2])) * bin_w[2]) + bin_w[2]/2.0;
         }
    }
    void round_points_2(){
         for(std::size_t i = 0; i < Xp.size();i++){
             Xp[i][0] = min[0] + (std::floor((Xp[i][0] - min[0]) * nbins[0] / (max[0] - min[0])) * bin_w[0]) + bin_w[0]/2.0;
             Xp[i][1] = min[1] + (std::floor((Xp[i][1] - min[1]) * nbins[1] / (max[1] - min[1])) * bin_w[1]) + bin_w[1]/2.0;
         }
    }
    void round_points_1(){
         for(std::size_t i = 0; i < Xp.size();i++){
             Xp[i][0] = min[0] + (std::floor((Xp[i][0] - min[0]) * nbins[0] / (max[0] - min[0])) * bin_w[0]) + bin_w[0]/2.0;
         }
    }
public:

std::vector<std::array<double,N> > Xp;
std::vector<double> min, max, nbins, bin_w;
};

这个类表示一个多维网格,维度由模板值N指定。我将进行许多操作,通过具有针对特定维度的模板特定成员函数(如循环展开)可以使这些操作更加高效。
在TGrid类中,我有3个特定于D = 1,D = 2和D = 3的函数。这是由函数的下标_1,_2和_3表示的。
我正在寻找一种面向模板元编程的方法来更紧凑地编写这三个函数。
我已经看过循环展开的示例,但所有这些示例都没有考虑模板类的成员函数。

1
不要这样做。使用通用的 round_points 和第二个循环。array::size() 是 constexpr 的,编译器会自行决定是否展开循环是一个好主意。 - pmr
3
我将进行多个手术,通过具有针对特定维度的模板成员函数(例如循环展开),可以使操作更加高效。哦,对了。测量一下 - Cheers and hth. - Alf
我已经测量了其他操作(如边缘化等)的时间,这些小细节往往会产生影响。原因是我正在处理高达4千兆字节的网格。 - Guillaume
1个回答

2
放置是否这是一个适当的优化,或者其他优化应该首先考虑的问题,这是我会这样做。 (但我同意,有时明确展开循环是更好的 - 编译器并不总是最好的判断。)
不能部分特化成员函数,也不能在不特化外部结构的情况下特化嵌套结构,因此唯一的解决方案是使用单独的模板结构来进行展开机制。可以将其放置在其他名称空间中 :)
展开实现:
template <int N>
struct sequence {
    template <typename F,typename... Args>
    static void run(F&& f,Args&&... args) {
        sequence<N-1>::run(std::forward<F>(f),std::forward<Args>(args)...);
        f(args...,N-1);
    }
};

template <>
struct sequence<0> {
    template <typename F,typename... Args>
    static void run(F&& f,Args&&... args) {}
};

这个函数接受一个任意的函数对象和一个参数列表,然后使用这些参数和额外的最后一个参数N调用该对象N次,其中最后一个参数的取值范围从0到N-1。通用引用和可变参数模板不是必需的;在C++98中可以使用相同的思路实现,但泛化程度较低。

round_points<K> 然后使用一个辅助静态成员函数调用 sequence::run<K>

template <size_t N>
class TGrid {
public:
    template <size_t K>
    void round_points(){
        for (std::size_t i = 0; i < Xp.size();i++) {
            sequence<K>::run(TGrid<N>::round_item,*this,i);
        }
    }

    static void round_item(TGrid &G,int i,int j) {
        G.Xp[i][j] = G.min[j] + (std::floor((G.Xp[i][j] - G.min[j]) * G.nbins[j] / (G.max[j] - G.min[j])) * G.bin_w[j]) + G.bin_w[j]/2.0;
    }

    // ...
};

编辑:附录

使用成员函数指针实现相同的功能似乎很难被编译器内联。作为替代方案,可以使用lambda表达式来避免使用静态round_item,例如:

template <size_t N>
class TGrid {
public:
    template <size_t K>
    void round_points(){
        for (std::size_t i = 0; i < Xp.size();i++) {
            sequence<K>::run([&](int j) {round_item(i,j);});
        }
    }

    void round_item(int i,int j) {
        Xp[i][j] = min[j] + (std::floor((Xp[i][j] - min[j]) * nbins[j] / (max[j] - min[j])) * bin_w[j]) + bin_w[j]/2.0;
    }

    // ...
};

谢谢你的回答,我会尝试一下。也感谢你回答问题时没有讨论它是否是一个合适的优化。 - Guillaume
你为什么将圆形项目设置为静态的? - Guillaume
有两个原因:首先,不使用指向成员函数对象或std::mem_fn可以使代码更清晰;但其次,这样可以更容易地让编译器内联。另一种选择是将round_item保持为非静态的,但将lambda传递给sequence<K>::run()。我会编辑答案以适应。 - halfflat

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接