我已经阅读了这个问题What's the performance penalty of weak_ptr?,但是我的测试结果与之不同。
我正在使用智能指针制作委托。下面的简单代码显示了weak_ptr
的性能问题。有人可以告诉我原因吗?
#include <chrono>
#include <functional>
#include <iostream>
#include <memory>
#include <stdint.h>
#include <string>
#include <utility>
struct Foo
{
Foo() : counter(0) { incrStep = 1;}
void bar()
{
counter += incrStep;
}
virtual ~Foo()
{
std::cout << "End " << counter << std::endl;
}
private:
uint64_t counter;
uint64_t incrStep;
};
void pf(const std::string &md, const std::function<void()> &g)
{
const auto st = std::chrono::high_resolution_clock::now();
g();
const auto ft = std::chrono::high_resolution_clock::now();
const auto del = std::chrono::duration_cast<std::chrono::milliseconds>(ft - st);
std::cout << md << " \t: \t" << del.count() << std::endl;
}
And the test:
int main(int , char** )
{
volatile size_t l = 1000000000ULL;
size_t maxCounter = l;
auto a = std::make_shared<Foo>();
std::weak_ptr<Foo> wp = a;
pf("call via raw ptr ", [=](){
for (size_t i = 0; i < maxCounter; ++i)
{
auto p = a.get();
if (p)
{
p->bar();
}
}
});
pf("call via shared_ptr ", [=](){
for (size_t i = 0; i < maxCounter; ++i)
{
if (a)
{
a->bar();
}
}
});
pf("call via weak_ptr ", [=](){
std::shared_ptr<Foo> p;
for (size_t i = 0; i < maxCounter; ++i)
{
p = wp.lock();
if (p)
{
p->bar();
}
}
});
pf("call via shared_ptr copy", [=](){
volatile std::shared_ptr<Foo> p1 = a;
std::shared_ptr<Foo> p;
for (size_t i = 0; i < maxCounter; ++i)
{
p = const_cast<std::shared_ptr<Foo>& >(p1);
if (p)
{
p->bar();
}
}
});
pf("call via mem_fn ", [=](){
auto fff = std::mem_fn(&Foo::bar);
for (size_t i = 0; i < maxCounter; ++i)
{
fff(a.get());
}
});
return 0;
}
结果:
$ ./test
call via raw ptr : 369
call via shared_ptr : 302
call via weak_ptr : 22663
call via shared_ptr copy : 2171
call via mem_fn : 2124
End 5000000000
从上面可以看出,weak_ptr
在使用拷贝和std::mem_fn
时比shared_ptr
慢了10倍,在使用原始指针或者shared_ptr.get()
时则慢了60倍。
weak_ptr
进行线程安全的获取其所绑定的shared_ptr
,这个过程是比较慢的。只有在无法确定所共享的对象是否已被销毁时,才应该使用weak_ptr
。否则,请使用原始指针。 - Galikmem_fn
部分根本不需要时间,这表明它已经将十亿次调用优化为简单的一次计数器增量。因此,我将计数器更改为“volatile”,然后raw_ptr和shared_ptr情况花费的时间与shared_ptr复制和mem_fn相同。我会看看你的编译器如何优化raw_ptr和shared_ptr情况。(使用v4.9时,我得到了类似于你的结果。) - rici