资源描述:
《计算机系统结构实验报告》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、WORD格式整理计算机系统结构实验报告一.流水线中的相关实验目的:1.熟练掌握WinDLX模拟器的操作和使用,熟悉DLX指令集结构及其特点;2.加深对计算机流水线基本概念的理解;3.进一步了解DLX基本流水线各段的功能以及基本操作;4.加深对数据相关、结构相关的理解,了解这两类相关对CPU性能的影响;5.了解解决数据相关的方法,掌握如何使用定向技术来减少数据相关带来的暂停。实验平台:WinDLX模拟器实验内容和步骤:1.用WinDLX模拟器执行下列三个程序:?求阶乘程序fact.s?求最大公倍数程序gcm.s?求素数程序prim.s分别以步进、连
2、续、设置断点的方式运行程序,观察程序在流水线中的执行情况,观察CPU中寄存器和存储器的内容。熟练掌握WinDLX的操作和使用。2.用WinDLX运行程序structure_d.s,通过模拟找出存在资源相关的指令对以及导致资源相关的部件;记录由资源相关引起的暂停时钟周期数,计算暂停时钟周期数占总执行周期数的百分比;论述资源相关对CPU性能的影响,讨论解决资源相关的方法。3.在不采用定向技术的情况下(去掉Configuration菜单中EnableForwarding选项前的勾选符),用WinDLX运行程序data_d.s。记录数据相关引起的暂停时钟
3、周期数以及程序执行的总时钟周期数,计算暂停时钟周期数占总执行周期数的百分比。在采用定向技术的情况下(勾选EnableForwarding),用WinDLX再次运行程序data_d.s。重复上述3中的工作,并计算采用定向技术后性能提高的倍数。1.求阶乘程序用WinDLX模拟器执行求阶乘程序fact.s。这个程序说明浮点指令的使用。该程序从标准输入读入一个整数,求其阶乘,然后将结果输出。 该程序中调用了input.s中的输入子程序,这个子程序用于读入正整数。实验结果:在载入fact.s和input.s之后,不设置任何断点运行。a.不采用重新定向技术,
4、我们得到的结果学习参考资料分享WORD格式整理b.采用定向技术,我们得到的结果:从上面的数据我们可以看出定向的作用:在定向技术存在的情况下Statistics窗口中的各种统计数字:总的周期数(215)和暂停数(17RAW,25Control,12Trap;54Total)在定向技术不存在时候,控制暂停和Trap暂停仍然是同样的值,而RAW暂停从17变成了53,总的模拟周期数增加到236。所以定向技术带来的加速比: 236/215=1.098 DLXforwarded比DLXnotforwarded快9.8%。2.数据相关先给出一个存在数据相关
5、的程序:LHIR2,(A>>16)&0xFFFFADDUIR2,R2,A&0xFFFFLHIR3,(B>>16)&0xFFFFADDUIR3,R3,B&0xFFFFloop:LWR1,0(R2)ADDR1,R1,R3SW0(R2),R1LWR5,0(R1)ADDIR5,R5,#10ADDIR2,R2,#4SUBR4,R3,R2BNEZR4,loopTRAP#0A:.word0,4,8,12,16,20,24,28,32,36B:.word9,8,7,6,5,4,3,2,1,0没有采用定向技术时运行该程序:得到学习参考资料分享WORD格式整理程序执
6、行了202个周期,10个数据相关引起的时钟周期RAWstall为104个。暂停时钟周期数占总执行周期数的百分比=51.48%采用定向技术时运行该程序:得到程序执行了128个周期,共有6个数据相关引起的时钟周期RAWstall为30个。暂停时钟周期数占总执行周期数的百分比=23.44%可见通过定向技术,减少了数据相关,缩短了程序的执行周期,整个性能为原来的1.57倍。3.结构相关下面这段程序存在结构相关ADDIR5,R5,1SUBIR4,R4,1ANDR3,R3,R3XORR7,R7,R7ADDIR8,R8,1ADDIR9,R9,1MULTR1,R
7、5,R4MULTR2,R3,R7执行之后得到的clockcycleprograme学习参考资料分享WORD格式整理Statistics:可见1个结构相关引起了4个stall,占总共20个CYCLE的20%为了避免结构相关,可以考虑采用资源重复的方法,比如,在流水线机器中设置相互独立的指令存储器和数据存储器,也可以将CACHE分割成指令CACHE和数据CACHE。二.循环展开及指令调度实验目的:1.加深对循环级并行性、指令调度技术、循环展开技术以及寄存器换名技术的理解;2.熟悉用指令调度技术来解决流水线中的数据相关的方法;3.了解循环展开、指令调度
8、等技术对CPU性能的改进。实验平台:WinDLX模拟器实验内容和步骤:1.用指令调度技术解决流水线中的结构相关与数据相关(1)用DLX汇