欢迎来到天天文库
浏览记录
ID:50321393
大小:1.77 MB
页数:28页
时间:2020-03-12
《CAE-CFD应用与解决方案.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、CAE-CFD应用与解决方案CAE仿真对高性能计算的需求计算机辅助工程(CAE)与高性能计算更快的速度更高的精度更大的规模问题——如何选择提供最佳应用性能的硬件?CAE软件众多,对硬件的需求不一硬件更新速度迅速:处理器、互联方式、体系结构曙光公司与MSC、ANSYS、ESI等领先的CAE软件厂商合作,为用户提供最佳的解决方案!1.1CAE软件的不同需求对于Ansys、Nastran以及Abaqus等应用程序并行度不高,扩展性一般小于16CPU单个作业对内存的要求很大单个作业对I/O的空间和性能要求很高以ANSYS为例SPARS
2、E----DSPARSE10GB/MDOF(in-core)10GB/MDOFI/OPCG----DPCG1GB/MDOFwithoutMSAVE0.5GB/MDOFI/O虚拟内存(或swap)严重影响速度内存的存取速度是硬盘的几十~几百倍!计算主进程比从进程需要更大内存主进程担负更多(数据管理、域划分等)主进程需要持续的高性能I/O减少I/O对CPU的占用避免共享文件夹/NFS并行I/O系统(Raid0)I/O对于Fluent、CFX、LS-Dyna等程序并行效果好能够在集群环境下并行到超过128个cpu以双路服务器性价比最
3、高对内存的需求不强烈通常1个cpucore配置1GB内存即可满足需要。对本地交换硬盘性能要求不高一般采用SCSI/SATA硬盘即可采用高速互联设备可以大幅度提高性能以Fluent为例,8个双路计算节点时采用Infiniband互联设备的性能会比千兆以太网好50%以上。Linux操作系统比Unix操作系统更加广泛采用,可根据需要选择Windows对于Feko等电磁场程序采用PO/UTD方法,并行效果很好,能够在集群环境下并行到超过128个cpu采用MoM/FMM方法,并行扩展性不高,小于16cpu对内存和I/O的要求比隐式有限元
4、程序还要高得多CAE软件可扩展性隐式结构力学MSC.NASTRANMARCANSYSABAQUS/Standard显式结构力学LS-DYNAAutoDynDytranABAQUS/Explicit计算流体力学FluentSTAR-CD/HPCPowerFLOWCFXCFD-Fastran计算电磁学Feko矩量法/FMM<16cpuPO/UTD>128cpu声学分析sysnoise处理器的选择AMDOpteron&IntelXeon软件兼容性好,管理方便,成本低,性能较高IBMPower&Intel安腾性能较高但价格昂贵,软件兼
5、容度不高发展趋势双核、四核、多核X86和RISC的融合运算加速技术等1.2哪些硬件可供选择互联方式的选择千兆以太网,带宽小(理论值125MB/s),延迟大35--45µs;Myrinet:MPI乒乓测试带宽:230MB/s,MPI短消息延迟:7µs;Infiniband;MPI乒乓测试带宽:850MB/s,MPI短消息延迟:<7µs;体系结构的选择共享内存结构内存支持统一编址处理器之间通过高速总线连接OpenMP支持内部通信能力强例子曙光A950IBMP575集群结构内存无法统一编址计算单元通过网络相连MPI支持内部通信能力较
6、弱例子曙光TC4000IBM1350SMPor集群?SMP服务器适用的地方基于OpenMP/多线程需要大量I/O操作Nastran、Ansys、Abaqus、Sysnoise集群服务器适用的地方基于多进程扩展性较好需要分布式任务Fluent、CFX、Ls-Dyna、FEKOSMP+集群解决方案面临的问题传统方式RISCSMP服务器+CISCX86集群RISCSMP服务器价格较为昂贵1最典型的异构平台特征2无法实现统一调度3分立存储方式4?2.曙光CAE高性能计算平台完全基于x86-64处理器的平台SMP节点和Cluster节点
7、之间可以实现最大限度的软硬件兼容性采用Infiniband网络进行所有节点之间的高速连接DCAS/DCJM可对系统软硬件资源进行完善的管理SKVM可对系统进行方便的操作、管理和监控2.曙光CAE高性能计算平台千兆管理网络TC2600刀片集群A950SMP节点A620I/O节点核心光纤存储阵列A400W图形工作站区千兆骨干网络LicenseServerInfiniband计算网络冗余管理/登录节点方案特点1一体化:完全基于x86-64平台,整合SMP小型机、刀片集群、SAN存储以及作业管理软件方案特点2高性能每台SMP服务器天阔
8、A950提供32处理器内核和256GB以上内存,32*4*2.0G=2560亿次每台TC2600刀片机箱提供80个处理器内核和64*10GB以上内存,80*4*2.0G=6400亿次10/20Gbps高速Infiniband网络大幅度提升并行计算性能全4Gb光纤存储网络方案特
此文档下载收益归作者所有