10得票1回答
每个时钟周期的浮点运算次数 - Intel

我已经寻找了一段时间,但似乎找不到一个官方的/确定的数字,它引用了一个Intel Xeon四核可以完成的单精度浮点运算/时钟周期的数量。 我有一个Intel Xeon四核E5530 CPU。 我希望利用它计算出CPU可以实现的最大理论FLOP/s。 MAX FLOPS =(#核心数)*(时钟频...

7得票2回答
在x86架构上跨页面边界进行软件预取

我的理解是,硬件预取永远不会跨越页面边界。我想知道软件预取是否有同样的限制,即我是否可以使用软件预取来避免未来的TLB缺失。从搜索结果来看,这似乎是可能的,但我在文档中没有找到确定性的说明,因此需要提供参考文献。 我特别关注 Nehalem、Sandy Bridge 和 Westmere。