首页 理论教育 并行性能分析的重要作用

并行性能分析的重要作用

时间:2023-06-26 理论教育 版权反馈
【摘要】:图9.6配置1中PSDP并行计算结果图9.7配置2中PSDP并行计算结果在计算耗时上,PSDP方法比串行方法有非常明显的削减。但是,PSDP方法各方案出现最优并行性能的测试环境有所区别。在核数较少的配置1中,PSDP最优并行计算耗时均出现在4核超线程开启状态下;在核数较多的配置2中,PSDP最优并行性能出现的测试环境分别为32核超线程关闭、32核超线程关闭和32核超线程开启。

并行性能分析的重要作用

从表9.4~表9.6中可以看到,在配置1中,随着电站规模的增加,SDP方法从59202s增长到157205s;在配置2中,SDP方法从65602s增长到183942s。因此,SDP串行方法的计算耗时随着计算规模的增加迅速增长。而且,SDP串行方法在配置1中的计算时间少于配置2,一个主要原因是配置1的时钟频率(3.30GHz)大于配置2的时钟频率(2.27GHz),运算速度比配置2更快。

图9.6 配置1中PSDP并行计算结果

(www.xing528.com)

图9.7 配置2中PSDP并行计算结果

在计算耗时上,PSDP方法比串行方法有非常明显的削减。在配置1中,PSDP方法三个测试方案最优并行计算耗时比串行方法分别缩减43745s、66891s、118002s;在配置2中,PSDP方法分别缩减62056s、109904s、175060s。但是,PSDP方法各方案出现最优并行性能的测试环境有所区别。在核数较少的配置1中,PSDP最优并行计算耗时均出现在4核超线程开启状态下;在核数较多的配置2中,PSDP最优并行性能出现的测试环境分别为32核超线程关闭、32核超线程关闭和32核超线程开启。此外,在同一核数超线程关闭和开启状态下,并行算法的计算耗时有所差异。在配置1中,任意多核环境下超线程开启的计算耗时少于超线程关闭,“超线程”技术提高配置运算速度的优势能够充分发挥;在配置2中,当测试环境核数较多时,超线程开启会加剧线程管理消耗及通信时间,增加计算耗时。因此,超线程技术的开启或关闭,同样需要对算法进行测试。

在加速比上,PSDP方法获得了较好的效果。在配置1中,PSDP方法三个测试方案最大加速比分别为3.83、3.92、4.01;在配置2中,PSDP方法三个测试方案最大加速比分别为18.50、19.60、20.71。PSDP方法各方案最优加速比出现的测试环境与最优并行计算耗时相同。因此,随着计算任务规模的增加,并行计算的最优加速比逐步提高,且越接近理想加速比,更好地发挥并行计算的优势。在同一配置中相同测试环境下,计算规模更大的任务能够获得更优的加速比。此外,在配置1中,PSDP方案3在4核超线程开启状态下发生了超线性加速比现象,主要原因在于Fork/Join是一种内存共享的并行技术,算法并行化可共用内核中的缓存,同时,Fork/Join中独特的队列设计,减少了访问临近元素产生的缓存争夺,提高了运算速度。

效率上,当超线程技术启闭状态相同时,随着测试环境核数的增加,效率逐渐下降,主要原因除了管理消耗以及通信时间的影响外,PSDP方法仅实现了算法整个求解过程的局部并行化,其他运行过程为串行计算,而且,为了避免数据同步,并行计算需在子线程中各自单独定义字段存储计算结果,造成更多的内存占用,影响并行效率。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈