首页 > 技术 > Altair > > RADIOSS并行计算及其在上海超算中心的应用

RADIOSS并行计算及其在上海超算中心的应用

作者:王 惠,丁峻宏    来源:Altair    发布时间:2012-10-18    收藏】 【打印】  复制连接  【 】 我来说两句:(0逛逛论坛

 

4典型应用

本文测试模型为整车正面刚性壁碰撞,定义初始撞击速度为13.75m/s,计算正面碰撞30ms,每2ms间隔输出一个ANIM文件。整个模型共有单元数135万,节点数128万。为对并行程序计算效果进行比较和评价,除了对比计算模型总耗时外,还可以采用加速比和并行效率这两个指标来衡量程序的并行性能。用来度量并行处理效果,而用来度量并行计算中整个系统的资源利用率,即: 

                 (1)

                   (2)

式中,表示使用单个处理器所耗费的时间,表示使用p个处理器所耗费的时间。当时,表明并行程序有完全的线性加速比,此时。一般情况下,由于受程序算法并行度,负载平衡度或网络通信等影响,理想的加速比是达不到的。


 

图3 魔方上不同核数RADIOSS计算时间和加速比

本文对RADIOSS并行能力评估主要是针对engine求解过程。Engine求解过程中,输出ANM文件的时间间隔基本一致,对输出ANIM文件的时间间隔求平均更能体现并行程序的求解时间。为了排除其他因素影响,这组计算是在同一个计算节点上完成。图3显示了不同核数下输出ANIM文件的平均时间间隔以及计算得到的加速比值,多核计算采用的是SPMD并行模式。从图上可以看出,随着处理器核数的增加,模型求解时间有较大幅度的降低,在2至4核时体现了近似线性的加速比,使用8核以上资源时,加速比提升趋势逐渐放缓,当采用8,16,32核计算时,并行效率依次为97.6%,79.1%,69.6%,随着并行核数的增加,由于额外开销时间的增多,并行效率呈逐级下降趋势。


 

图4  RADIOSS Hybrid-MPP并行计算对比

对RADIOSS Hybrid-MPP并行计算来说,在求解engine过程中参与计算的核心数等于MPI进程数(SPMD求解域数)与OpenMP并行thread数的乘积。图4显示了在保证总计算核数为16个情况下,Hybrid-MPP使用不同的MPI进程数和OpenMP thread数对计算速度的影响。从图4中可以看出,对于整车碰撞这一类问题,采用SMP并行模式计算时间最长,随着MPI进程数的增加,计算时间依次递减,也就意味着并行效率依次提高。当16个核全部采用SMP并行方式时,并行效率只有32.3%,而全部采用MPP并行方式时并行效率达到79.1%。相同求解核数下,采用Hybrid-MPP并行并不一定比单纯的MPP并行计算速度更快,但Hybrid-MPP能在相同的进程数下扩展线程数,增加了并行求解的扩展能力和性能,灵活的并行方式满足计算需要和硬件资源的升级,当MPI进程数较多或求解模型更复杂等情况下,进程间通信量的增加将对计算产生额外开销,而采用Hybrid-MPP并行将更具有优势。

 
分享到: 收藏