并行性能分析的重要作用

更新时间：2025-01-09 工作计划版权反馈

【摘要】：图9.6配置1中PSDP并行计算结果图9.7配置2中PSDP并行计算结果在计算耗时上，PSDP方法比串行方法有非常明显的削减。但是，PSDP方法各方案出现最优并行性能的测试环境有所区别。在核数较少的配置1中，PSDP最优并行计算耗时均出现在4核超线程开启状态下；在核数较多的配置2中，PSDP最优并行性能出现的测试环境分别为32核超线程关闭、32核超线程关闭和32核超线程开启。

从表9.4～表9.6中可以看到，在配置1中，随着电站规模的增加，SDP方法从59202s增长到157205s；在配置2中，SDP方法从65602s增长到183942s。因此，SDP串行方法的计算耗时随着计算规模的增加迅速增长。而且，SDP串行方法在配置1中的计算时间少于配置2，一个主要原因是配置1的时钟频率（3.30GHz）大于配置2的时钟频率（2.27GHz），运算速度比配置2更快。

pagenumber_ebook=125,pagenumber_book=117

图9.6　配置1中PSDP并行计算结果

pagenumber_ebook=126,pagenumber_book=118 (www.xing528.com)

图9.7　配置2中PSDP并行计算结果

在计算耗时上，PSDP方法比串行方法有非常明显的削减。在配置1中，PSDP方法三个测试方案最优并行计算耗时比串行方法分别缩减43745s、66891s、118002s；在配置2中，PSDP方法分别缩减62056s、109904s、175060s。但是，PSDP方法各方案出现最优并行性能的测试环境有所区别。在核数较少的配置1中，PSDP最优并行计算耗时均出现在4核超线程开启状态下；在核数较多的配置2中，PSDP最优并行性能出现的测试环境分别为32核超线程关闭、32核超线程关闭和32核超线程开启。此外，在同一核数超线程关闭和开启状态下，并行算法的计算耗时有所差异。在配置1中，任意多核环境下超线程开启的计算耗时少于超线程关闭，“超线程”技术提高配置运算速度的优势能够充分发挥；在配置2中，当测试环境核数较多时，超线程开启会加剧线程管理消耗及通信时间，增加计算耗时。因此，超线程技术的开启或关闭，同样需要对算法进行测试。

在加速比上，PSDP方法获得了较好的效果。在配置1中，PSDP方法三个测试方案最大加速比分别为3.83、3.92、4.01；在配置2中，PSDP方法三个测试方案最大加速比分别为18.50、19.60、20.71。PSDP方法各方案最优加速比出现的测试环境与最优并行计算耗时相同。因此，随着计算任务规模的增加，并行计算的最优加速比逐步提高，且越接近理想加速比，更好地发挥并行计算的优势。在同一配置中相同测试环境下，计算规模更大的任务能够获得更优的加速比。此外，在配置1中，PSDP方案3在4核超线程开启状态下发生了超线性加速比现象，主要原因在于Fork/Join是一种内存共享的并行技术，算法并行化可共用内核中的缓存，同时，Fork/Join中独特的队列设计，减少了访问临近元素产生的缓存争夺，提高了运算速度。

在效率上，当超线程技术启闭状态相同时，随着测试环境核数的增加，效率逐渐下降，主要原因除了管理消耗以及通信时间的影响外，PSDP方法仅实现了算法整个求解过程的局部并行化，其他运行过程为串行计算，而且，为了避免数据同步，并行计算需在子线程中各自单独定义字段存储计算结果，造成更多的内存占用，影响并行效率。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈

工作思路

策划书

留守儿童

关工委

内部审计

爱国卫生

业务员

信息技术

教研员

心理教育

居委会

社区学校

公司安全

部门月度

区安全

公司工会

乡镇基层

劳动保障

经理年度

内科年度

教学个人

前台个人

个人月度

配班个人

并行性能分析的重要作用

相关推荐

并行性能分析的重要作用

有关梯级水电站群多核并行优化调度技术的文章

相关推荐