资源描述:
《计算机系统结构实验三》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、计算机系统结构实验报告班级实验日期4-10实验成绩姓名学号实验名称实验三、指令调度和延迟分支实验目的、要求实验目的:1、加深对指令调度技术的理解;2、加深对延迟分支技术的理解;3、熟练掌握用指令调度技术解决流水线中的数据冲突的方法;4、进一步理解指令调度技术对CPU性能的改进;5、进一步理解延迟分支技术对CPU性能的改进。实验内容、步骤及结果实验步骤:1、启动MIPSsim。2、根据2.5节相关内容关于流水线的描述,进一步理解流水线窗口中各段的功能;3、选择“配置”--“流水方式”选项;4、用指令
2、调度解决流水线中的数据冲突(1)启动MIPSsim;(2)用MIPSsim的“文件”—“载入程序”选项加载schedule.s;(3)关闭定向功能,“配置”—“定向”;(4)执行载入程序,通过查看统计数据与始终周期图,找出并记录程序执行过程中各种冲突的次数没发生冲突的指令组合以及程序执行的总周期数;程序执行的总周期数:33程序冲突的组合:ADDIU$r1,$r0,ALW$r2,0($r1)与上条写后读冲突;ADD$r4,$r0,$r2SW$r4,0($r1)与上条指令写后读冲突;LW$r6,4($
3、r1)ADD$r8,$r6,$r1与上条指令写后读冲突;MUL$r12,$r10,$r1ADD$r16,$r12,$r1与上条指令写后读冲突;ADD$r18,$r16,$r1与上条指令组件冲突SW$r18,16($r1)与上条指令写后读冲突;;LW$r20,8($r1)MUL$r22,$r20,$r14与上条指令写后读冲突;(5)采用指令调度技术对程序进行指令调度,消除冲突。将调度后的程序写入afer-schedule.s中。内容如示:.textmain:ADDIU$r1,$r0,AMUL$r22
4、,$r20,$r14LW$r2,0($r1)MUL$r24,$r26,$r14ADD$r4,$r0,$r2LW$r6,4($r1)SW$r4,0($r1)ADD$r8,$r6,$r1MUL$r12,$r10,$r1ADD$r18,$r16,$r1ADD$r16,$r12,$r1SW$r18,16($r1)LW$r20,8($r1)TEQ$r0,$r0.dataA:.word4,6,8(6)载入after-schedule.s;(7)执行该程序。观察程序在流水线中的执行情况,记录程序执行的总时钟周期
5、数。总时钟周期数为:21(8)根据记录结果,比较调度前与调度后的性能,论述指令调度对与提高CPU性能的作用;指令调度后时钟总周期数从33降低到21,通过使用指令调度技术显著地提高了CPU的使用率,大大减少了指令冲突的次数,对提高CPU性能有很大的作用。5、用延迟分支减少分支指令对性能的影响。(1)启动MIPSsim;(2)载入branch.s;(3)关闭延迟分支功能,“配置”—“延迟槽”(4)执行程序,观察并记录发生分支延迟的时刻;(5)记录执行改程序所需要的总时钟周期数(6)假设延迟槽为一个,对
6、branch.s进行指令调度,然后保存到delayed-branch.s中;代码如如示:main:ADDI$r2,$r0,1024ADD$r3,$r0,$r0ADDI$r4,$r0,8loop:LW$r1,0($r2)ADDI$r3,$r3,4ADDI$r1,$r1,1SUB$r5,$r4,$r3SW$r1,0($r2)BGTZ$r5,loopLW$r1,0($r2)ADD$r7,$r0,$r6TEQ$r0,$r0(7)载入delayed-branch.s;(8)打开延迟分支功能;(9)执行该程序
7、,观察其时钟周期图;(10)记录执行该程序所用的总时钟周期数;执行总周期数:26ID端执行了20条指令(11)对比上诉两种情况的时钟周期图;(12)根据记录结果,比较没采用延迟分支和采用了延迟分支的性能之间的不同,论述延迟分支对于条CPU性能的作用。答:对比两种情况的时钟周期总数可知,在使用延迟槽后,指令在运行到跳转指令附近时,在期望概率上很大部分可能不会出现延迟等待,故能够稍微提高CPU性能,但是在跳转指令较多的程序中,此方法更为实用。6、补充实验(1)通过配置菜单,把加法﹑乘法﹑除法部件的个数
8、设置为2个,把延迟都设置为3个时钟周期;用MIPS语言编写一段简单的程序,至少包含数据相关和结构相关,包含循环次数为4的倍数的循环,运行程序。记录程序执行过程中各种相关发生的次数、发生相关的指令组合,以及程序执行的总时钟周期数。按照要求写程序,但可对样例代码branch改编生成,结果如示:.textmain:ADD.D$f2,$f0,$f1SUB$r0,$r0,$r0ADDI$r2,$r0,1024ADDI$r4,$r0,16ADD$r3,$r0,$r0loop:LW$r1,0($