非结构网格Euler 并行算法研究

非结构网格Euler 并行算法研究

ID:38279198

大小:638.15 KB

页数:5页

时间:2019-05-26

非结构网格Euler 并行算法研究_第1页
非结构网格Euler 并行算法研究_第2页
非结构网格Euler 并行算法研究_第3页
非结构网格Euler 并行算法研究_第4页
非结构网格Euler 并行算法研究_第5页
资源描述:

《非结构网格Euler 并行算法研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、非结构网格Euler并行算法研究周磊朱培烨蔡江鹏中国航空计算技术研究所摘要对于非结构网格上的Euler流动的并行计算问题,本文针对同一网格,对比了坐标递归二分法,惯性递归二分法和多级递归图二分法的区域分割结果。另一方面,对比了粗细两种非结构网格方法的并行计算结果,得到它们的计算效率变化规律,分析这些变化规律的成因,对实际工程中并行加速比的定义提出了自己的看法。关键词并行计算,加速比1.引言为对飞行器外流绕流流场进行数值模拟,人们常常采用非结构网格来方便地对复杂的几何外形进行空间离散。注意与结构化网格相比,非结构网格计算需要大得多的内存空间来存储单元间不规

2、律的拓扑连结关系,同时计算量也增加了很多。所以,非结构网格上的流场数值模拟问题常常是计算规模庞大的工程问题,对此类问题进行并行计算研究正是当前计算流体力学领域的热点问题,见[1][3]。本文通过对一个简单标模的非结构网格Euler流动的并行计算,讨论大规模工程计算所涉及的区域分裂及加速比方面的问题。2.数值方法我们采用四步龙格库塔有限体积方法对三维M6机翼的定常绕流流场进行Euler数值模拟。采用了局部时间步长等加速收敛的方法。对计算区域采用四面体单元的非结构网格进行空间离散。计算区域见下图:图1计算区域示意图图2机翼附近局部放大图3.分区计算方法分区算

3、法的思想是将总体计算网格分成若干个块子计算网格,每块计算网格单独求解,在每个计算时间步后各子网格在其相邻子网格的边界处的解通过消息传递机制1(massage-passing)进行数据交换。区域分解的基本原则是,尽量使得每个子计算网格包含相同数量的计算单元。并行计算平台是12台SUN工作站以局域网络相联接,配以MPI并行通讯软件库构成,每台工作站内存为128兆。我们采用粗细两套网格(粗网格5.6万网格点,细网格9.3万网格点)来研究不同计算规模的问题的并行计算效果。我们分别采用了坐标递归二分法,惯性递归二分法(由坐标递归二分法改进而来)(见[4])和美国明

4、尼苏达大学GeorgeKarpis等人提出的多级图分区理论及其相应的Metis软件进行负载平衡分区,并比较了这三种分区方法对于同一问题(分割同一套密网格)的分区结果。图3总体网格分区图图4局部网格分区图上面是用Metis程序包将细网格的12块子网格进行分区后的结果图,左图是全貌图,而右图是左图中小黑框部分的局部放大图,注意:由于网格线消隐的作用,有些子区域看不到。经过统计,上述分区是比较平均的(每块网格的单元数离理想平均单元数的最大偏差在3%之内)4.结果与分析首先,粗网格12块的并行计算的结果与单块计算结果一致,细网格12块的并行计算的结果与2块并行计

5、算结果一致。且并行计算的区域块数与收敛速度无关。得到下面的各种非结构网格分区方法的计算结果对比表:rcbribmetis平衡偏差0.18456360.12055183.5641856E-02通讯量316532674816601通讯次数11010084在上表中,RCB表示递归坐标二分法,RIB表示递归惯性二分法,METIS表示多级图分区方法,而平衡偏差指的是各个子块所含单元与理想应含的平均单元数偏离的最大百分比。讨论一:从上面可以看出:无论从分割成的子块的均匀程度,单次迭代同步通讯时总的通讯量(交换数值的节点个数)还是通讯次数(发送接受次数)来说,多级图分

6、区方法的各项指标都是最好的,另一方面,从下面的结果可以看出:可能对于这三种分区方法来说:由于分配的都较均匀,且计算和通讯时间差别较大,所以三种分区方法在实际计算时单步迭代时间的差异基本可2以忽略。下面有关计算时间与并行处理工作站台数间的关系图5单迭代步计算时间与工作站台数关系上图中纵坐标表示每个迭代步的平均墙上时间(单位为秒),横坐标表示工作站的个数。三角形的数据点反映的是密网格所测得的数据;正方形的数据点反映的是疏网格所测得的数据。另外,上方的实线段反映的是过(x=2)的密网格数据点的曲线(XY=C,C为某常数);虚线段反映的是过(x=4)的密网格数据

7、点的曲线(XY=C,C为某常数);下方的实线段反映的是过(x=1)的密网格数据点的曲线(XY=C,C为某常数)。讨论2:我们注意到,密网格的数据点处于过(x=2)密网格数据点的曲线(XY=C,C为某常数)的下方,并处于过(x=4)密网格数据点曲线(XY=C,C为某常数)的上方。这说明,对于计算规模很大的密网格计算问题,用常规的加速比来度量,出现了超线性收敛的情况。同时,我们对于上图中的每个数据点,记录了当时计算机CPU工作效率的变化规律(记录30分钟的数据,采样900点):图6细网格2台工作站时CPU的运行效率图3图7细网格4台工作站时CPU的运行效率图

8、图8细网格6台工作站时CPU的运行效率图4图9粗网格1台工作站时CPU的运行效率

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。