在我正在用C++编写的AI应用程序中,
特别地,与虚拟函数相关的优化技术有哪些?虚拟函数是通过内存中的虚拟表实现的。是否有一种方式可以预取这些虚拟表到L2缓存中(从内存/L2缓存中检索的成本正在增加)?
除此之外,在C++中有哪些关于数据局部性的优化技巧?这些技巧将减少计算所需的数据从L2缓存中获取的等待时间。 更新:还请参阅以下相关论坛:使用接口的性能惩罚,多级基类是否减慢了C++中的类/结构体
- 数值计算不多
- 需要运行时多态的结构很多
- 在计算过程中,经常有几个多态结构互相交互
特别地,与虚拟函数相关的优化技术有哪些?虚拟函数是通过内存中的虚拟表实现的。是否有一种方式可以预取这些虚拟表到L2缓存中(从内存/L2缓存中检索的成本正在增加)?
除此之外,在C++中有哪些关于数据局部性的优化技巧?这些技巧将减少计算所需的数据从L2缓存中获取的等待时间。 更新:还请参阅以下相关论坛:使用接口的性能惩罚,多级基类是否减慢了C++中的类/结构体