佳工机电网 在线工博会 我的佳工网 手机版 English
关键字  
  选择展区 >>
您的位置: 首页 > CAD/CAM/PDM/PLM展区 > CAE/模拟仿真展厅 > 产品库 > 技术论文 > 正文 产品库 会展 人才 帮助 | 注册 登录  
CAE/模拟仿真
 按行业筛选
 按产品筛选
查看本类全部文章
e展厅 产品库 最新动态 技术文章 企业目录 资料下载 视频/样本 反馈/论坛
  技术应用 | 基础知识 | 外刊文摘 | 业内专家 | 文章点评 投稿 发表科技文章 
RADIOSS显式并行计算性能最新进展
作者:澳汰尔工程软件(上海)有限公司
欢迎访问e展厅
展厅
2
CAE/模拟仿真展厅
通用有限元分析软件, 结构分析软件, 动力学分析软件, 声学分析软件, 板料冲压成形模拟软件, ...
摘要:显式并行计算一直是汽车、航空航天、军工和电子行业在模拟碰撞、冲击、爆炸、跌落等瞬态高度非线性问题的唯一选择。随着计算机硬件及软件技术的发展,求解时间已经有量级上的缩短。但是随着对问题研究的深入,我们需要更精细的网格及带失效模式的本构关系来模拟局部的失效模式;此外计算机硬件架构的变化,多核心处理器及GPU计算单元的出现,使得如何有效的利用现有硬件架构进行并行程序的开发成为软件开发人员重视的问题。本文将介绍RADIOSS在提高并行计算性能方面所使用的新方法,包括高级质量缩放、多域求解技术、Hybrid-MPP。
关键字:并行计算,高级质量缩放,多域求解,Hybrid-MPP,RADIOSS

1 简介

显式有限元求解技术一直以来都是汽车行业、航空航天、军工和电子行业用于模拟碰撞、高速冲击、爆炸和跌落等高度非线性问题的唯一选择。尤其是在汽车行业,随着安全法规的健全各大主机厂都在碰撞数值仿真方面进行大量投入,从而节省用于实验的原型车数量及缩短整个产品开发周期,提高产品安全性并加快新车型投入市场速度。在过去的近30年时间,整车的有限元网格规模已经从80年代的10,000单元发展到现在的1,000,000~2,000,000单元,单元规模增加了100~200倍。当然计算机硬件的发展及并行MPI的开发,使得整车碰撞仿真的时间并没有同样幅度的增加。但是即使采用现有的硬件和软件并行技术,当前整车碰撞仿真的时间还是在几个小时到十多个小时之间。因此,当前汽车设计开发中,还没有办法进行碰撞安全性的优化及考虑可靠性的分析,以及对部件使用集成失效模型的破坏分析。然而在未来的5~10年,这些必定会成为仿真中要考虑的问题。除此之外,多核CPU及GPU计算技术的发展,要求并行软件的开发方面必须要有所创新,才能充分利用现有硬件架构来提高并行计算性能,满足越来越精细的仿真需求。RADIOSS作为业内的一款显式求解器,已经在这方面进行了一系列的尝试与改进,并取得了显著的突破。

RAIOSS是新一代的线性和非线性仿真有限元求解器。它可以用来模拟结构、流体、流-固耦合、金属薄板料冲压和机构系统运动。这一功能强大的,多学科的解决方案使制造商能够最大限度地提高设计的耐久性、噪音和振动性能、耐撞性、安全性和可制造性,以使新产品更快地投向市场。从1987年发布第一个版本一直到现在,RADIOSS已经在汽车、军工行业有了超过20年的成功应用经验。从最初应用于PSA和FORD的汽车安全仿真发展到航空航天、军工、铁道、电子、生物等行业。RADIOSS在2006年加入到Altair Engineering公司的HyperWorks软件包中之后,目前已经发布最新的10.0版本,在软件的可靠性、可扩展性、计算可重复性方面都有长足的进步。本文下面的内容将着重介绍最新应用于RADIOSS求解器中的高级质量缩放、多域求解、Hybrid-MPP技术,及其在实际模型中的应用效果。

2 高级质量缩放

质量缩放(mass scaling)在显式碰撞分析中并不是新的概念,它广泛的应用于提高整个模型求解的时间步长。标准的质量缩放方法通过在一些单元时间步长较小的单元节点上增加质量,从而来提高单元的时间步长。这种方法会人为的引入非物理的质量、能量到整个模型中,因此使用时需要小心谨慎。实际使用中不能在局部部件上增加过多质量而引起部件全局属性的改变,这限制了这一方法所能将时间步放大的倍数。这也是为什么在汽车行业在制定网格划分标准时需要指定一个合理的最小单元长度的原因。为了解决标准质量缩放的这一问题,一些研究人员提出了用于显式有限元分析的选择质量缩放技术[1]。RADIOSS软件实现并发展了这一技术,在软件中提供高级质量缩放能力。RADIOSS中的高级质量缩放通过修改质量矩阵非对角项来提高时间步。

M = [m] + A

其中的A由单元质量矩阵组装,对一个四节点壳单元来讲单元质量矩阵为

newmaker.com

使用高级质量缩放可以提供更高的并行可扩展性,而且只改变结果中的高频部分,对低频影响很小,可以应用于整车碰撞仿真中。这一方法通常可以将时间步长提高10到20倍,但同时也会因为需要做非对角质量矩阵的求逆消耗一部分计算时间。对于这一方法我们使用如下的测试模型来进行比较(如图1所示)。模型为一盒装梁一端固定,另一端受2200N的力载荷。梁材料使用Johnson-Cook弹塑性本构模型。两个模型分别使用大尺寸的网格(时间步Δt=0.57μs)和精细网格(时间步Δt=0.15μs)。图2为在5ms时两个模型的变形图。

newmaker.com
图1. 测试模型示意图

newmaker.com
图2. 5ms时粗糙网格模型与精细网格模型变形图

针对这一模型,我们使用5种不同的求解设置来比较计算时间及梁端部节点位移响应。a)粗糙网格,使用缺省时间步长Δt=0.57μs;b)精细网格,使用缺省时间步长Δt=0.15μs;c)精细网格,使用标准质量缩放强制时间步长为Δt=0.57μs;e)精细网格,使用高级质量缩放强制时间步长为Δt=0.57μs;f)精细网格,使用高级质量缩放强制时间步长为Δt=1μs。五种设置的端部位移响应如图3所示。

newmaker.com
图 3. 不同设置端部节点位移响应曲线

从图3可以看到粗糙网格的结果a无法正确描述结构的变形,结果c因为引入了太多的质量,使实际的模型已经无法表示正确表示物理模型,端部节点位移也无法表示实际的状态。B,e,f的结果均可以表现出结果的屈曲,而且三条曲线的结果非常接近。这三个可信结果模型的求解时间和加速率比较如表1所示。从b,e的结果可以看到,理论上讲从时间步长0.15us增加到0.57us时加速率应该为3.8,但实际中因为高级质量缩放方法需要额外的CPU资源进行质量矩阵进行求逆,所以实际的加速比会比这个小,但已经可以看出可观的改进。

newmaker.com

3 多域求解

在很多的显式积分法求解器中,整个模型的时间步由具有最小的时间步的单元控制。而多域求解的想法是将整个模型分为物理上等效的子域模型,每一个独立的域拥有不同的时间步长。每一个子域作为独立的模型使用自己的时间步求解,子域间力和力矩的传递通过一个独立的程序来进行计算并确保了稳定性约束条件(如图4所示)。

newmaker.com
图 4. 多域求解架构

每一个独立的域为一个完整的RADIOSS可计算模型,它独立运行,并只与RAD2RAD这个程序进行管道通信。域和域之间的同步,只在指定的时间进行。如图5所示,假设两个域A和B拥有独立的时间步长ta和tb(ta>tb),两个域独立运行,但都与RAD2RAD进行通信,两个域在指定的时间点(图中红色时间点)进行交界面的力,力矩等物理量的同步。

newmaker.com
图 5. 时间步同步示意图

图6为一头部撞击汽车前面板上部的碰撞仿真。其中雨刷部分零组件网格比较精细,而整个车体其它结构部件网格尺寸相对较大,所以这两个部分之间的时间步差别较大。使用多域求解技术,可以将雨刷零组件单独放在一个域中,而将整个车的其它部件放在另一个域中(如图6所示)。

newmaker.com
图 6. 头部撞击模型及其多域分块方式

针对这个模型的分域方式,使用单一域和两个域的方式在1、16、32、64个CPU下计算所需计算时间对比如表2所示。对比表明在这个实际模型中,多域比单域计算时间能减小一半,而且从1CPU到64CPUs时多域求解比单域求解加速比依然能保持在2.01。在计算结果精度方面,单域与多域求解下头部的加速度响应曲线如图7所示。

newmaker.com

newmaker.com
图 7. 单域与多域求解时头部加速度响应曲线

4 Hybrid-MPP

随着多核心处理器的出现,它也被越来越多的应用于计算集群。图8为典型的并行计算集群的计算单元的架构。每一个计算节点(Node)由多个CPU组成(对应Socket1,Socket2…),而每一个CPU又有多个核(对应C1,C2…),每个节点共享内存(对应M1,M2…),所有独立的计算节点通过快速交换网络设备进行互联。Hybrid-MPP并行模式在每一个独立的节点上使用OpenMP方式进行并行,而在节点之间通过MPI的方式进行并行。通过使用优化的消息传递机制有效减少节点和节点之间的消息量,从而在大规模的并行计算中有效发挥现有硬件架构的整体性能。RADIOSS最新版本已经实现这一并行模式,而且在实际的整车碰撞模拟中取得了计算速度上的巨大突破。

newmaker.com
图 8. 典型集群计算单元架构及Hybrid-MPP方式Threads分布

在使用标准的正面碰撞测试模型NEON_1M[2]于Intel Nehalem 2.8GHz集群上进行实际测试中,RADIOSS Hybrid-MPP并行模式显示出非常好的加速性能。在保证总核数为16个情况下,Hybrid-MPP使用2~8threads时总的计算时间由SPMD方式的1301s减少到256s(图9所示)。

newmaker.com
图 9. 使用Hybrid-MPP与传统SPMD方式计算速度对比

5 结论

RADIOSS一直在提高有限元求解器并行计算性能方面进行着著有成效的创新。在最新的实车碰撞仿真测试中,集成了最新的求解技术的求解器已经能够在拥有1024个核的集群上5分钟之内求解完成[3]。这种并行计算扩展性方面的突破为涉及碰撞仿真分析的优化、可靠性分析、精细破坏模拟等成为可能。

6 参考文献
[1] L.Olovsson,K.Simonsson and M.Unosson. Selective mass scaling for explicit finite element analysis. Int.J.Numer. Meth. Engng 2005
[2] Neon(1M elements) frontal Crash, http://www.altairhyperworks.com.cn/Benchmark.aspx
[3] Altair Achieves Breakthrough Time Savings in Crash Simulations,
http://www.hpcwire.com/offthewire/Altair-Achieves-Breakthrough-Time-Savings-in-Crash-Simulations-68875192.html

作者简介

曾神昌,男,硕士,Altair公司高级工程师,有限元技术应用专家。北京航空航天大学固体力学系毕业,在汽车及电子行业的有限元技术应用方面有丰富经验。联系邮箱support@altair.com.cn,联系电话21-61171666。

欧贺国,男,硕士,Altair公司高级工程师,汽车碰撞安全仿真专家。合肥工业大学机械工程系毕业,具有丰富的汽车碰撞安全仿真分析及物理试验经验。联系邮箱support@altair.com.cn,联系电话21-61171666。

洪清泉,男,硕士,Altair公司技术支持经理,优化应用专家。北京理工大学车辆工程专业毕业,曾工作于上海飞机设计研究所,在汽车和飞机结构分析和优化方面具有丰富经验。联系邮箱support@altair.com.cn,联系电话21-61171666。(end)
文章内容仅供参考 (投稿) (如果您是本文作者,请点击此处) (11/25/2010)
查看更多CAE/模拟仿真相关文章: more
·西门子数字孪生解决方案推动水下农业发展 Siemens (4/7/2022)
·Altair OptiStruct助力超音速汽车“寻血猎犬” Altair (11/25/2010)
·利用LabVIEW NI SoftMotion模块和SolidWorks改进设计流程 Lisa Mosier (11/24/2010)
·视觉化的3D设计让模拟栩栩如生 达索系统 (11/24/2010)
·个人空气净化吹风器:让你感觉无所不在的畅快呼吸 newmaker (11/17/2010)
·数据中心的六大创新--面向企业的新产品和技术 simucad (11/2/2010)
·基于HyperStudy的COMSOL多物理场分析案例 Altair公司 (10/31/2010)
·solidThinking在汽车车灯设计上的成功案例 Altair公司 (10/31/2010)
·ANSYS复杂几何模型的网格划分技术 newmaker (10/25/2010)
·虚拟现实和模拟工具提高了流程设备规划设计的效率 newmaker (10/16/2010)
查看相关文章目录:
·CAD/CAM/PDM/PLM展区 > CAE/模拟仿真展厅 > CAE/模拟仿真文章
文章点评 查看全部点评 投稿 进入贴吧


对 CAE/模拟仿真 有何见解?请到 CAE/模拟仿真论坛 畅所欲言吧!


网站简介 | 企业会员服务 | 广告服务 | 服务条款 | English | Showsbee | 会员登录  
© 1999-2024 newmaker.com. 佳工机电网·嘉工科技