桌面i7-4770k @ 4GHz的核心GFLOPS峰值为4GHz * 8(AVX)*(4 FMA)* 4个核心= 512 GFLOPS。但最新的Intel IGP(Iris Pro 5100/5200)峰值超过800 GFLOPS。因此,一些算法在IGP上运行得更快。将核心与IGP组合在一起会更好。此外,IGP不断吞噬更多硅。 Iris Pro 5100现在占据了超过30%的硅。显然,英特尔台式机处理器的方向是清晰的。
就我所见,除了OpenCL / OpenGL之外,程序员大多忽略了英特尔IGP。我很好奇如何在没有OpenCL的情况下编写适用于计算(例如SGEMM)的Intel HD Graphics硬件的程序? 添加评论:在Linux上,Intel不支持HD图形和OpenCL。我发现了beignet,这是一种开源尝试,至少为Ivy Bridge HD图形添加Linux支持。我没有尝试过它。可能正在开发Beignet的人知道如何编程HD图形硬件而不需要OpenCL。
就我所见,除了OpenCL / OpenGL之外,程序员大多忽略了英特尔IGP。我很好奇如何在没有OpenCL的情况下编写适用于计算(例如SGEMM)的Intel HD Graphics硬件的程序? 添加评论:在Linux上,Intel不支持HD图形和OpenCL。我发现了beignet,这是一种开源尝试,至少为Ivy Bridge HD图形添加Linux支持。我没有尝试过它。可能正在开发Beignet的人知道如何编程HD图形硬件而不需要OpenCL。