片上多核处理器体系结构下的串行程序加速方法

片上多核处理器体系结构下的串行程序加速方法

ID:36763423

大小:2.07 MB

页数:56页

时间:2019-05-14

片上多核处理器体系结构下的串行程序加速方法_第1页
片上多核处理器体系结构下的串行程序加速方法_第2页
片上多核处理器体系结构下的串行程序加速方法_第3页
片上多核处理器体系结构下的串行程序加速方法_第4页
片上多核处理器体系结构下的串行程序加速方法_第5页
资源描述:

《片上多核处理器体系结构下的串行程序加速方法》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、}l◆分类号UDC论文题目密级编号研究生:处岩指导教师:位童强塾援专业:让簋扭丕统结捡.研究方向:.邀处理墨笠丕结趁所在学院:让篡扭堂院2011年6月11日原创性声明本人声明:所呈交的学位论文是本人在导师的指导下进行的研究工作及取得的研究成果。除本文已经注明引用的内容外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得内墓直太堂及其他教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论支作者签名:墨3丛日期:塑!i!垂:!l指导教师签名:堑弦坠.

2、日.期:鲨!∑盟/在学期间研究成果使用承诺书本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:内蒙古大学有权将学位论文的全部内容或部分保留并向国家有关机构、部门送交学位论文的复印件和磁盘,允许编入有关数据库进行检索,也可以采用影印、缩印或其他复制手段保存、汇编学位论文。为保护学院和导师的知识产权,作者在学期间取得的研究成果属于内蒙古大学。作者今后使用涉及在学期间主要研究内容或研究成果,须征得内蒙古大学就读期间导师的同意;若用于发表论文,版权单位必须署名为内蒙古大学方可投稿或公开发表。学位论文作者签名:圣)】迷日期:

3、堡!!:区:11指剥币躲五警坠日期:丝iL厶:!l内蒙古大学硕士学位论文片上多核处理器体系结构下的串行程序加速方法摘要多核处理器经历了十几年的发展,目前已经成为处理器市场的主流。但是,由于结构性差异,传统的串行程序并不能在多处理器体系结构下获得性能提升。本文主要探讨如何在片上多核处理器体系结构下加速串行程序执行。为解决这一问题,本文主要从两个独立的方向进行尝试。片上多核处理器丰富的硬件资源为加速串行程序执行性能提供了一种新的可能。更大的指令窗口和最后一级缓存能够提升大多数串行程序的执行性能。本文中,我们提出了一种简单的虚拟窗

4、口机制加速串行程序执行。方法的基本思想是将指令窗口中的长延迟指令发送到其它核,同时将最后一级缓存的换出块发送到其它核的空闲缓存空间中,进而形成一个较大的指令窗口和最后_级缓存。所有的传输操作对程序员是透明的。一个核可以静默的分享同一芯片上其它核的空闲硬件资源。方法的硬件开销很小且容易实现。初步实验证明该方法是提升片上多核微处理器平台下串行程序性能的有效选择。同时,本文提出了基于子组的适应性缓存替换策略用以提升缓存性能。该方法将最后一级缓存组分成多个子组,一定时间内只有一个子组为活跃组其它子组为非活跃组。当缓存失效发生时换出块

5、仅从活跃子组中选取。同时,每个缓存组都将设置一个计数器统计缓存失效数,当计数大于给定阈值,活跃子组将切换到相邻子组。为了适应程序行为的变化,方法采取了组竞争策略,动态从阈值池中选择造成缓存失效最小的阈值。实验证明,单核情况下,该方法相比传统LRU策略获得5.5%几何平均性能提升,部分测试程序提升50%以上。多核实验中获得平均6%的吞吐量提升和平均6.8%的加权加速比提升。片上多核处理器体系结构下的串行程序加速方法关键词:串行程序,片上多核微处理器,指令窗口,缓存替换策略,子组,组竞争Ⅱ内蒙古大学硕士学位论文SpeedupSe

6、quentialProgramPerformanceOilChipmulti—coreprocessor(ABSTRACTExperiencedtenyearsofdevelopment,Multicoreprocessorshavebecomeamainstreaminprocessormarket.However,thetraditionalsequentialprogramscannotbenefitfromthemulti—coreprocessorsbecauseofstructuraldifferences.In

7、thisthesis,wemainlystudythepropermethodstopromotesequentialprogramperformanceonchipmulti—processor.Tosolvethisproblem,weproposedourcreativeideasintwoseparatedirections.ChipMulticoreprocessorprovidesnewopportunitytofastsequentialprogram‘performancewiththeavailabledu

8、plicatedhardwareresourcesinthecores.MostofexistedsequentialprogramscanbenefitfromalargerinstructionwindowandabiggerL2cache.Inthisthesis,wepropose

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。