首页 > 技术 > Altair > > RADIOSS并行计算及其在上海超算中心的应用

RADIOSS并行计算及其在上海超算中心的应用

作者:王 惠,丁峻宏    来源:Altair    发布时间:2012-10-18    收藏】 【打印】  复制连接  【 】 我来说两句:(0逛逛论坛

摘要:计算机硬件架构的升级以及并行化理论的成熟,促使大规模求解程序朝着并行化的方向发展。RADIOSS软件是Altair公司HyperWorks平台中一个重要的隐式和显式有限元求解模块,本文结合RADIOSS软件在上海超算中心的应用实际和硬件资源,探讨了RADIOSS显式并行计算的原理和方法,分析了整车碰撞安全性分析在不同处理器数目下的计算效率以及RADIOSS并行求解方式对计算效率的影响,为该类问题的大规模计算以及更好地发挥RADIOSS的并行计算优势提供参考。

关键字:RADIOSS, 高性能计算(HPC), “魔方”, Hybrid-MPP

1引言

计算机软硬件和有限元仿真理论的不断发展使得人们对产品的虚拟开发要求越来越高,系统级多体耦合仿真和多物理场耦合仿真已成为虚拟产品开发的发展方向,用户不再追求单一个体在单一物理场(如结构力学,流体力学)的仿真结果,而是将研究对象的完整系统(如整机、整车)或影响系统性能的所有物理因素一次性纳入计算范畴,重点考察各物理因素综合起来对分析对象或者整个系统的影响。这类问题的求解往往需要在硬件上有更强的计算能力和更多内存,而现有单台计算机的处理能力和内存都不可能无限制的增加,硬件环境已经成为制约高水平科研与产品创新的瓶颈。随着集群技术和并行计算理论的发展,高性能计算(HPC)在越来越多的领域中得到应用,很多科研单位,公司和机构都拥有自己的HPC系统。由于HPC系统能调用网络环境中的多个处理器资源进行并行计算,从而能更快的获得计算结果,显著缩短计算时间,许多商业软件都致力于基于HPC网络环境下的并行化开发,并取得良好的应用效果,为大规模复杂问题的求解提供了契机。

RADIOSS是Altair公司HyperWorks平台中一个重要的隐式和显式有限元求解模块,其丰富的求解算法和数值处理技术能最大限度的提高产品设计的耐久性,碰撞安全性和可制造性,改善产品NVH性能,也可以用来求解流固耦合等多物理场问题。RADIOSS可以使用HyperMesh或HyperCrash作为前处理器,HyperView作为后处理器,对于大规模问题的仿真,用户可以一个操作界面友好,统一集成的环境中完成从建模到仿真结果分析的整个过程。本文结合RADIOSS在上海超算中心的应用实际和硬件资源,分析了整车碰撞安全性分析在不同处理器数目下的计算效率以及RADIOSS并行求解方式对计算效率的影响,为该类问题的大规模计算以及更好地发挥RADIOSS的并行计算优势提供参考。

2 RADIOSS并行计算

计算机硬件架构的升级以及并行化理论的发展,促使大规模求解程序朝着并行化的方向发展,并行化程序必须充分利用现有硬件资源来提高自身并行计算性能,并行处理能力将进一步提高程序内在价值,也有助于大规模问题的求解。RADIOSS融合最新的数值计算方法和并行算法,在提高求解效率方面有取得了富有成效的进展,例如求解器中集成的高级质量缩放,多域求解,Hybrid-MPP等技术,在实际中都取得了较为理想的应用效果,特别是RADIOSS的非线性显式并行求解技术,通过将单个任务划分成多个子任务,并把这些子任务分配到不同的处理器上进行并行求解,从而能更快的获得计算结果,缩短产品研发周期,为大规模碰撞安全性优化以及可靠性分析,复杂多物理场耦合计算,精细化多体耦合等问题的求解提供了可能。

RADIOSS强大的并行计算功能支持 Shared Memory Parallelism(SMP)和Single Program Multiple Data(SPMD)两种并行模式。Shared Memory Parallelism是共享内存式并行, 指多核共享内存并行计算;Single Program Multiple Data是分布式内存并行计算,每个参与计算的核心有独立的内存,指多机多CPU的并行计算。随着多核处理器的出现和集群技术的发展, RADIOSS的最新版本中加入了Hybrid-MPP并行模式,其并行模式的架构如图1所示,每个计算节点由多个CPU组成(Socket1,Socket2),而每个CPU又有多个核(C1,C2),节点内部共享内存(M1,M2),节点间通过快速交换设备进行互联。该模式融合了OpenMP和MPI的技术特点, OpenMP适用于计算节点内部共享内存并行,MPI适用于节点和节点之间分布式内存的并行,这两种并行方式的结合有助于在大规模并行计算中发挥集群硬件架构的整体性能,为多处理器集群提供了一种有效的并行策略。


 

图1  Hybrid-MPP并行模式

3计算资源环境

“魔方”系统目前是上海超级计算中心运营的主力资源之一,该机在2009年全球高性能计算机TOP500排行榜中排名第十,这也是当年除美国外世界上最快的高性能计算机系统,图2为 “魔方”超级计算机实景图。全机拥有1450个刀片节点和82个胖节点组成的计算节点以及40个功能节点,高效的Infiniband网络互连实现全线速集群内部无阻塞的网络交换。工程计算区主要由胖节点(AMD opteron 8347HE,单节点8CPU4核处理器,1.9GHz, 128G内存)组成,本次对RADIOSS的测试计算主要在胖节点上完成。


 

图2 “魔方”系统实景图

同时上海超算中心为了增强向工业企业提供CAE/CFD仿真计算服务的能力,于2012年6月部署了一台运算速度为21万次每秒的IBM集群计算机,通过用户集体投票命名为“蜂鸟”集群。该集群包括65台HS23刀片计算节点(intel E5-2670,单节点2CPU8核处理器,2.6GHz, 64G内存),并分别配置了6台与4台x3650M3机架服务器作为管理节点和存储节点,同时配置了2台dx360M3作为图形服务器,所有节点通过Infiniband网络高速互连。硬件环境的升级将有助于提高并行计算处理能力,本文通过对RADIOSS并行计算测试进一步了解“蜂鸟”机群的加速性能。

 
分享到: 收藏