在多线程程序中使用exprtk

12

我需要编写一个程序,其中字符串表达式会经常被评估。 以下是表达式示例:

"x0*a0*a0+x1*a1+x2*a2+x3*a3+x4*a4....."

表达式可能很长,一个字符串可以包含多个这样的表达式。

我使用C++库exprtk编写了一些测试代码。

vector<std::string> observation_functions;
vector<std::string> string_indices;


template<typename T>
float* get_observation(float* sing_j, float* zrlist, int num_functions,int num_variables)
{
    //omp_set_nested(1);

    float* results = (float*)malloc(sizeof(float)*num_functions);
    exprtk::symbol_table<float> symbol_table;

    exprtk::expression<T> expression;
    exprtk::parser<T> parser;
    int i;
    for( i = 0; i < num_variables; i++)
    {
            symbol_table.add_variable("x"+string_indices[i], sing_j[i]);
            symbol_table.add_variable("a"+string_indices[i], zrlist[i]);
    }

    expression.register_symbol_table(symbol_table);
    for(i = 0; i < num_functions; i++)
    {
            parser.compile(observation_functions[i],expression);
            results[i] = expression.value();
    }
    return results;
}



int main()
{

    for( int i = 0; i < 52; i++)
    {

    ostringstream s2;
    s2<<i;
    string_indices.push_back(s2.str());
    }



    string hfun ="x0*a0*a0+x1*a1+x2*a2+x3*a3+x4*a4+x5*a5+x6*a6+x7*a7+x8*a8+x9*a9+x10*a10+x11*a11+x12*a12+x13*a13+x14*a14+x15*a15+x16*a16+x17*a17+x18*a18+x19*a19+x20*a20+x21*a21+x22*a22+x23*a23+x24*a24+x25*a25+x26*a26+x27*a27+x28*a28+x29*a29+x30*a30+x31*a31+x32*a32+x33*a33+x34*a34+x35*a35+x36*a36+x37*a37+x38*a38+x39*a39+x40*a40+x41*a41+x42*a42+x43*a43+x44*a44+x45*a45+x46*a46+x47*a47+x48*a48+x49*a49+x50*a50+x51*a51 ";


    boost::split(observation_functions, hfun, boost::is_any_of(" "));
    float *a=(float*)malloc(52*sizeof(float));
    float* c=(float*)malloc(52*sizeof(float));

    struct timeval t0,t1;
    gettimeofday(&t0, 0);
    for(int j=0; j < 210; j++)
        #pragma omp parallel for schedule(static,1) num_threads(8)
        for(int i=0;i<104;i++)
            float* b =get_observation<float>(a,c,1,52);
    gettimeofday(&t1, 0);
    long elapsed = (t1.tv_sec-t0.tv_sec)*1000000 + t1.tv_usec-t0.tv_usec;
    cout<<"elapsed:"<<elapsed<<endl;

}   

请注意这是测试代码。在实际情况中,每个线程将使用不同的一组值来评估表达式。这段代码可以正常工作,但我需要让它更快。

根据其他一些实验,我发现无法共享单个符号表以使多个线程计算单个表达式更快。共享符号表会导致内存损坏错误。

能否请有经验的人提供一些建议,帮助我提高性能。


2
考虑使用 std::vector & zrlist。然后,您还可以使用 symbol_table.add_vector("a", zrlist);。请注意,第二个参数通过引用(而不是 const)传递给 add_variable/add_vector,并且其值可能会被 exprtk 更改。 - John_West
1
你的多线程应用程序失败了,因为exprtk不是线程安全的。因此,在多个线程中共享一个对象/表格会导致竞争和内存损坏问题。 - John_West
2个回答

15
假设您有N个线程。然后,在主程序for循环之外)中创建N组与exprtk相关的对象(包括symbol_tableexpressionparser)。您可以使用vector<>来存储它们:例如,对于expression对象,它将是vector<expression> expressions;。然后,在调用函数时传递对这些对象的引用。
for(int i=0;i<104;i++)
    get_observation<float>(expressions[i], more params here..)

模板函数定义:template <typename T> T* get_observation(expression & exp, 更多参数在此处..)

你也可以创建一组对象,并通过复制来创建其他对象,就像Aloalo 建议的那样

P.S. 最好使用智能指针,https://dev59.com/uWMk5IYBdhLWcg3wtQBd#19042634,不要忘记删除在本地分配的内存。


6

你可以尝试仅构建exprtk对象一次,并为每个线程创建副本。如果复制exprtk对象的速度比构建它们的速度快,则应该更快。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接