高通量众核并行模拟加速技术研究

高通量众核并行模拟加速技术研究

ID:35107573

大小:7.26 MB

页数:68页

时间:2019-03-18

高通量众核并行模拟加速技术研究_第1页
高通量众核并行模拟加速技术研究_第2页
高通量众核并行模拟加速技术研究_第3页
高通量众核并行模拟加速技术研究_第4页
高通量众核并行模拟加速技术研究_第5页
资源描述:

《高通量众核并行模拟加速技术研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、?心印夺国钟^若来大赛UniversityofScienceandTechnoloofChinagy硕±学位论文加速化米研奔.论文题目急遗量众枯并行摸私作者姓名方国决计算机科学与技术学科专业姿紅妓疹导师姓名二〇—六■年十月完成时间牛逸种#栽禾乂#硕±学位论文戀高通量众核处理器模拟器性能优化作者姓名:方国庆学科专业:计算机科学技术导师姓名:安虹教授—完成时间:二〇六年六月UniversityofScienceandTechnologyofChinaA’

2、DissertationforMastersDereeg戀PerformanceOptimizationofS-imulatorforHighthroughputMan-coreProcessoryA’u化orsName;GuoinFangqgSpeciality:ComputerScienceandTechnologySupervisor:Prof.HonAngFinishedTime:June2016,中国科学技术大学学位论文原创性声明本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得

3、的成果。除已特别加W标注和致谢的地方外,论文中不包含任何他人己经发表或撰写过的研究成果一。与我同工作的同志对本研究所做的贡献均己在论文中作了明确的说明。。.作者签名:豕签字日期I:中国科学技术大学学位论文授权使用声明作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,目P:学校有权按有关规定向国家有关部口或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可W将学位论文编入《中国学位论文全文数据库》等有关数据库进行检索,可采用影印、缩印或扫描等复制手段保存一、汇编学位论文。本人提交的电子文档的内容和

4、纸质论文的内容相致。保密的学位论文在解密后也遵守此规定。?开□保密().兵&年水V作者签名:如到义导师签名:巧0签字日期‘)?>0-:呼签字X(<日期:2|^摘要随着大数据应用日益普及,数据规模高速増长,对处理器性能提出巨大挑战。高通量众核处理器在运行速度、单位面积能耗1^及扩展性方面的改进成为计算机体系结构领域的研究热点。由于泣片制造工艺复杂、成本高昂,软件模巧器作为体系结构研究的重要工具在研巧的许多阶段中都发挥着非常重要的辅助作用。软件模拟器最重要的评价指标是模拟速度,尤其是在大规模众核结构模拟中,提高模巧速度至

5、关重要。本文详细地分析了现有的模拟器加速技术,并将其归类为提高单条指令或指令块模拟速度的技术、减少被模拟指令数量的技术レッ及利用硬件平台的并行性和提高模拟算法的并发度的技术。在此基础上,本文提出W下两个方案进斤对高通量众核处理器的模拟进行改进与优化。(1)基于优化单条指令或指令块的思路,本文提出使用查找表方法对指令译码进行加速。由于宿主机上拥有相对充足的内存资源,故可1^将模拟器运行过程中需要反复进行的一些计算预先完成并将结果W表的形式保留在内存中,后一,只进行次查表操作即可遇到同样的计算时。本文对译码过程中遇到的PopCoimt问题、条件域检

6、查W及踪迹缓存等方面使用查找表技术进行加速。查找表技术的引入既提升了指令译码的模拟速度,又使得编码实现更加简洁灵活。(2)基于利用硬件模拟平台并行性和提高模拟算法并发度的思路,设计实现了从多个角度优化的并行离散事件模拟框架。首先,模拟框架采用随机映射的-?事件调度算法,显著提高了模拟过程中的负载均衡性其次,框架采用ccleb;yycycle的时间推进算法消除了CMB同步算法中高额的同步开销,这得益于W红黑树结构对事件队列的管理;同时,框架基于单写者单读者模型实现未来事件队列的无锁化,避免了事件调度过程中的大量锁开销。最后,在模拟过程中,大数据

7、负载中海量的离散数据访问请求表现为组件频繁的内存操作,本文选择内存池方案对其进行管理。内存池方案W少数几次大规模内存分配代替频繁的小规模内存申请和释放,回避了动态内存管理方案固有的操作延迟,内存操作效率提升显著。代表性的大数据应用包括单词计数(WordCount)、T级数据排序(TeraSort)W及模式匹配(KMP)被用于本文加速方案的性能评估。实验结果表明查找表方案将PopCount问题解决速度提高%.14倍,并行离散事件模拟框架的优化将总体性能提

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。