欢迎来到天天文库
浏览记录
ID:8268532
大小:384.38 KB
页数:9页
时间:2018-03-15
《HPCStack:一种基于KVM虚拟化和OpenStack 的高 …》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、8《高性能计算发展与应用》2015年第四期总第五十三期HPCStack:一种基于KVM虚拟化和OpenStack的高性能计算云平台唐宏伟1,2,3赵晓芳1,2刘祎洋4朱炜垚4杨富军4姚仲寅4秦东明5,6何牧君5,7廖杰1,2金岩1王晖1冯圣中2,31中国科学院计算技术研究所北京1001902中国科学院大学北京1000493中国科学院深圳先进技术研究院深圳5180554上海海计信息技术有限公司上海2012035曙光信息产业(北京)有限公司北京1000946同济大学嵌入式系统与服务计算教育部重点实验室上海2000927重庆大学计算机学院重庆4000
2、44{tanghongwei,zhaoxf,liaojie,jinyan,wanghui}@ict.ac.cn{yyliu,wyzhu,fjyang,zyyao}@mass-computing.com{qindm,hemj}@sugon.comsz.feng@siat.ac.cn摘要:云计算与虚拟化技术能够给高性能计算用户和服务提供商带来诸多好处,能够有助于解决安全隔离性等难题。我们认为,高性能计算云服务将是未来的发展趋势。然而,虚拟化性能损失和资源管理复杂性等问题给高性能计算应用向云计算迁移提出了巨大挑战。我们提出了一个基于KVM虚拟化和Op
3、enStack的高性能计算云平台——HPCStack。通过对KVM进行性能优化,降低虚拟化性能开销,提高性能隔离能力。基于计算资源池实现物理资源的整合、抽象与调度,通过两级调度满足保证服务质量和提高资源利用率的双重目标。此外,针对平台中数据存储的特点,提出了异构的存储方案以满足容量和I/O效率需求。我们对HPCStack中的独占式虚拟机进行了网络基准性能和应用性能测试。测试结果表明,经过优化后的虚拟机能够达到与物理机相近的性能。特别地,单台24个vCPU、110GB内存的虚拟机的Linpack效率能够达到73.66%,仅比相同配置的物理机低3.
4、17%,ABAQUS应用的性能仅比物理机低3%,FLUENT应用的性能仅比物理机低1%。关键词:高性能计算,虚拟化,KVM,OpenStack,计算资源池1.背景介绍式。一些大型企业集团自建高性能计算中心以满足云计算改变了人们获取计算、存储、应用等业务计算需求,而更多的企业机构则采用租用公共服务的方式,以按需的方式向用户提供可随时、随计算服务的模式。事实上,公共高性能计算服务已地访问的服务。在云计算模式下,用户只需要为所经初步具备了云计算的一些特征,如多用户共享资使用的服务付费,而无需自行购置、维护所需的硬源、按使用量计费(粒度较粗,如CPU小
5、时、年租、件、软件,从而能够快速、灵活、较低成本地响应月租等)、远程访问(基于公共网络或者专线)业务需求。等。一些高性能计算服务提供了基于WebPortal的应用服务接口[1][2],为用户提供便捷的图形化操作界高性能计算服务主要包括自建和租用两种方高性能计算技术9面,以隐藏复杂的作业提交、管理等命令行操作。(6)提高安全性。用户的访问和操作被限定在目前,在高性能计算平台的运维与服务过程独占的虚拟机和私有虚拟网络中,避免了对其它用中面临着一些难题,如资源扩展性差、安全隔离性户业务和数据越权访问等安全隐患。物理机群不再差、应用程序与系统运行环境兼
6、容性差、系统可靠暴露给用户,从而提高了整体上的安全性。性保障能力差等问题。在资源扩展性方面,出于管(7)提高可靠性。基于虚拟机在线检查点技理维护等方面的原因,一般会将高性能计算机群按术,在应用运行过程中可以保存CPU、内存、磁盘以照应用类型划分为若干个物理分区,每个分区运行及各种外设的状态,从而应用程序的状态也就被透不同类型的应用。分区的软硬资源一般固定不变,明地保存下来,在故障发生后可以恢复到最近的检这就限制了资源的流动和应用的扩展。在安全隔离查点继续运行,这对于提升可靠性十分重要。性方面,为了提高资源利用率,不同用户的作业往(8)给用户以更
7、大的灵活性。用户拥有虚拟机往会被调度运行在同一台计算节点上,一个应用的的控制权,从而为应用程序调试、调优,操作系统故障可能会导致操作系统甚至整个计算节点的异和运行时系统的优化和个性化定制提供便利。常,从而影响其它应用的运行。此外,允许用户登(9)提高弹性扩展能力。物理机群不必按照应录共享的计算节点也会对其它用户的数据和业务安用固定分区,可以进行整体管理、统一调度,按需全造成潜在威胁。在应用程序兼容性方面,用户的动态地为应用构建运行环境并快速部署,从而应用开发、测试环境往往与线上运行环境不同,应用程规模不再受分区限制。序上线运行时常常面临着重新编
8、译甚至是代码移植综上所述,虚拟化技术能够对高性能计算产生等工作。在系统可靠性方面,由于机群规模大,软深远的影响,能够在管理和服务方面带来较大的变硬件以
此文档下载收益归作者所有