大规模计算机系统并行仿真技术研究

大规模计算机系统并行仿真技术研究

ID:26539486

大小:60.50 KB

页数:8页

时间:2018-11-27

大规模计算机系统并行仿真技术研究_第1页
大规模计算机系统并行仿真技术研究_第2页
大规模计算机系统并行仿真技术研究_第3页
大规模计算机系统并行仿真技术研究_第4页
大规模计算机系统并行仿真技术研究_第5页
资源描述:

《大规模计算机系统并行仿真技术研究》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、大规模计算机系统并行仿真技术研究-->第1章绪论1.1计算机体系结构仿真技术背景仿真器由于其重要作用,在学术界与产业界都得到了广泛的应用。据统计,2001年和2004年在体系结构国际会议ISCA(InternationalSymposiumonputerArchitecture)上的论文分别有88%和87%采用了仿真器作为实验评测的手段,这一比例至今尚未有明显改变。学术界普遍使用的仿真器有SimpleScalar(AustinandLarson2002),Asim(Emeretal,2002)、MS(Nathanetal,2006)、Simics(

2、MagnussonandChristensson2002),Qemu(Bellard2005)等;产业界的一些大型公司也都开发了自己专有的仿真器,例如IBM公司的MamboCPatricketal,2004)HP与AMD联合开发的COTSon(ArgolloandFalconetal,2009.)AMD公司的SimNo-Godson(张福新,章隆兵2007)等。不同的仿真技术在精确度、速度、灵活性以及开发复杂度等指标方面各有侧重,本文将分别阐释相关概念以便于后续研究内容的展开论述。首先明确文中用到的一些基本术语。Simulation与Emulati

3、on在计算机体系结构领域常常分别译为模拟与仿真,但本文遵从一般离散事件仿真领域的用法:仿真(Simulation)强调时间概念,而模拟(Emulation)与对象的功能相关,例如IPS)为标准。在一定时期内,宿主平台的性能较为一致,因此以绝对性能进行横向比较也是合适的。仿真器的性能受多方面影响,模型多寡、目标程序长短、指令基本块模式都会极大的影响仿真器的运行时间,仿真器所选择的实现技术更是直接决定了仿真器的基本性能。仿真开销的存在使得仿真器速度远慢于真实机器,而体系结构研究发展的趋势又表现为向工业界靠拢,实验过程需要采用规模庞大的工业测试程序,并且

4、需要覆盖较多的程序,进行反复的测试,这些状况都加剧了仿真器的性能问题。高精准度与高速度是仿真技术同时追求的目标,然而这两项目标之间常常相互抵触。用户为了获得可靠的实验数据,希望尽可能的提升仿真器目标系统与真实系统的近似程度,这意味着细致的建模,与真实系统相匹配的模型参数,以及全系统建模、执行驱动等技术的应用,其结果是模型复杂度的上升,造成仿真速度的下降。反之,速度的提升则通常都是依靠牺牲精确度换来的。不过,随着模型细化程度的提高、目标系统与测试程序规模的逐渐膨胀,当前仿真器的主要问题仍集中在性能的低下上,仿真技术发展的近期目标仍是在兼顾精确度的基础

5、上提升仿真器的性能,以微小的精确度损失换来性能的大幅上升。遵循着这一目的,从仿真器的不同方面出发,学术界及产业界己发展出了几种技术方向,下文将依次介绍。............................第2章体系结构并行仿真技术分析架构差异较大的不同目标系统,在并行化处理时所面临的问题往往也有所不同,也就是说,体系结构并行仿真技术必须根据所仿真的对象寻找解决方案,本文将首先介绍面向不同目标系统的并行仿真技术。不过体系结构并行仿真也服从并行计算、一般系统并行仿真的规律,本文将接着介绍体系结构并行仿真针对一些关键问题从这些领域内借鉴的方法。最后我

6、们通过对一些典型的体系结构并行仿真器的分析归纳出并行仿真技术的发展趋势。2.1面向不同目标系统的并行仿真技术2.1.1单处理器并行仿真早在单处理器仿真的时代,体系结构研究人员就己经利用了并行处理技术加速仿真器的执行。单处理仿真器从目标系统的角度较难并行化,因为单处理器内部的部件结合较为紧密,尽管可以将一些大的部件剖分开,形成处理核心、高速缓存、总线外设等分离的模块,但难以进一步拆分此类部件,从而使得并行度丧失提高的潜力。例如将处理器核心按流水线各阶段分割,并剥离出分支预测器、执行功能单元、重排序缓存等微体系结构后,由于这些部件之间存在复杂而频繁交互

7、行为,并行处理时的通信开销将会抵消并行度上升带来的性能收益。即使-->只是前述粗粒度的分割,由于通常处理核心模块的执行开销较大,负载平衡性亦可能成为阻碍达到理想加速比的重要因素。而且部件剥离工作具有较高的开发难度,将一款串行模拟器并行化一般涉及到以下几点工作:将部件间共享访问的状态变量利用加锁、复制、数组化、私有化等手段使得变量被线程独占访问或转化为进程的私有数据;隐含有通信功能的状态变量,需要把对该变量的直接访问过程转化为依靠共享队列、消息等媒介的间接通信过程;访问了已经数组化或者私有化变量的函数调用接口也必须在参数中加上相应的索引,或是重新构建

8、参数。此类工作随着部件交互的复杂程度而不断倍增。因而,在开发难度与性能开销的阻碍下,细粒度分割单处理器模型的并行化策略尚未

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。