魔方-2超级计算机介绍

魔方-2超级计算机介绍

ID:1081310

大小:222.07 KB

页数:4页

时间:2017-11-07

魔方-2超级计算机介绍_第1页
魔方-2超级计算机介绍_第2页
魔方-2超级计算机介绍_第3页
魔方-2超级计算机介绍_第4页
资源描述:

《魔方-2超级计算机介绍》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、66《高性能计算发展与应用》2015年第三期总第五十二期魔方-2超级计算机介绍邹伟新上海超级计算中心上海201203wxzou@ssc.net.cn摘要:魔方-2超级计算机从8月20日第一批硬件到场,曙光公司工程师和上海超级计算中心工程师一起争分夺秒从机房环境准备、硬件安装、系统调试、系统软件部署、应用软件调试等一系列机器安装联调工作,魔方-2超级计算机于9月25日正式对外试运行。目前机器的安全平稳运行,不论从用户使用量、机器使用率、作业运行量都在稳步提升中,实现了从曙光5000A转换到魔方-2超级计算机资源的安全平

2、稳过渡。关键词:魔方-2,存储系统,队列,Openpbs,Gridview1.魔方-2计算机背景介绍刀片,CPU整体峰值性能达到399.36万亿次/秒。每台上海超级计算中心自从2009年6月15日正式开通刀片计算节点配置2颗IntelXeonE5-2680v3(12core/使用魔方(曙光5000A)超级计算机系统。随着“魔2.5GHz),128GBDDR4内存。方”开通启用,化解了当时上海地区高性能计算资系统配备8台登录节点,配置2颗E5-2640v3源的瓶颈,成为支撑上海创新研发所必须的计算基(8core/2.6

3、GHz),64GBDDR4内存。础设施;同时,它还服务于一系列国家级重大工程系统配备7台管理节点,配置2颗E5-2640v3和基础研究项目,对提高我国的创新能力具有战略(8core/2.6GHz),64GBDDR4内存性意义。部署曙光Gridview3.2集群管理系统,用户可但随着机器的运行,曙光5000A超级计算机已经通过IP地址实现Web访问。超级服役了近6个年头。曾位列世界第十、亚洲第一部署曙光ParaStor200并行存储系统,裸容量的“魔方”机型,先后被国内“天河一号”、“天为1056TB,有效容量达7

4、57TB。河二号”等更快机型超越,目前在top500中仅仅排在系统配置2个万兆交换机、2个千兆交换机,436名,并且成了服役年龄最大的上榜者。由几十个组成万兆上联管理网。机柜阵列组成的“魔方”机组一直坚持工作至最后系统配置4台W560-G10工作站,负责对集群关机,监控屏幕上的小片灰色增多默默显示着它越的日常监控、系统操作。来越“力不从心”。因此上海超算寻求新的计算资系统配置1套线速互联的648口Infiniband高源的矛盾日益突出。为了解决日益窘境的计算资源速网络交换机问题,由曙光公司提供一定的计算资源来接替

5、曙光本集群共有8个登录节点,2个用来作为FTP服5000A超级计算机的计算能力,继续为科学计算、公务,2个用来作为TELNET服务,2个web服务,2个用益事业等用户提供强大的高性能计算服务平台。作管理系统服务。2.魔方-2计算机介绍2.1系统整体概况机柜继续采用曙光5000A的原有的水冷机柜,能够满足魔方-2新机器的承重、制冷、功耗等基础机电需求。刀片计算系统共有415台曙光CX50-G20双路图1服务与管理节点对应表交流之窗672.2系统拓扑图图2系统拓扑图本集群采用现有市场成熟的高性能计算体系架就可以实现对服务

6、器的物理监控,大大简化了原有构,拥有完整的功能节点,提供了较高的计算能力的KVM管理模式,实现了系统管理维护的方便性和和大容量的存储能力。其中计算网络、存储网络、网络化。管理网络三套网络系统有效进行网络分离,各司其职,提供了安全高效互不干扰的计算平台。2.2.1IB高速计算网络该集群采用了世界领先的高性能端到端互连方案提供商Mellanox公司提供的Infiniband网络。每个节点直连到628口大型IB网络交换机上,保证了全线速运行。2.2.2IPMI管理网IPMI(IntelligentPlatformManage

7、mentInterface)即智能平台管理接口,是使硬件管理具备智能化的新图3IPMI管理网一代通用接口标准。用户可以利用IPMI监控服务器2.2.3万兆上联管理网络的物理特征,比如温度、电压、风扇工作状态等。通过TC4600E千兆管理模块,万兆交换机和千兆IPMI的最大优势在于它是独立于BIOS和OS,因此用交换机组成了一套高可靠、高带宽的万兆上联管理户无论在开机还是在关机的状态下,只要接通电源网络。图4万兆管理网络68《高性能计算发展与应用》2015年第三期总第五十二期2.3并行存储系统忍故障的磁盘数量;B代表容忍

8、故障的节点数量。本ParaStor200是曙光自主开发的分布式并行存储系集群采用的8+2:1保护策略,存储系统可以容忍2块硬统,采用多副本、N+M纠删码等数据保护技术、全盘同时失效。存储系统空间利用率可达到80%。冗余设计,支持单一存储命名空间、支持容量海量扩展,性能线性扩展,能够满足高性能计算中心海2.4曙光Gridview集群

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。