SIMD阵列高层建模与性能评估

SIMD阵列高层建模与性能评估

ID:39110247

大小:3.47 MB

页数:70页

时间:2019-06-25

SIMD阵列高层建模与性能评估_第1页
SIMD阵列高层建模与性能评估_第2页
SIMD阵列高层建模与性能评估_第3页
SIMD阵列高层建模与性能评估_第4页
SIMD阵列高层建模与性能评估_第5页
资源描述:

《SIMD阵列高层建模与性能评估》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、隶。初女◆粤工程硕士学位论文万方数据SIMD阵列高层建模与性能评估学科、专业:硕士生姓名:导师姓名、职称:二零一四年六月万方数据HIGHLEVELMODEL玳GANDPERFORMANCEEV_ALUATIONFORSIMDARRAYAThesisSubmittedtoSoutheastUniversityFortheAcademicDegreeofMasterofEngineeringBYSUKaiSupervisedbyAssoc.Prof.LINGMingandSeniorEngineerYUJi:nlienlorgnglneerU

2、JlanllSchoolofIntegratedCircuitsSoutheastUniversityJune2014万方数据东南大学学位论文独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得东南大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。研究生签名:盏鱼h日期:型‘『习邝叼东南大学学位论文使用授权声明东南大学、中国科

3、学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布(包括刊登)论文的全部或部分内容。论文的公布(包括刊登)授权东南大学研究生院办理。研究生签名葡盟导师签名:万方数据摘要当前,计算机系统已广泛引入能较好挖掘数据并行度的单指令多数据(SingleInstructionMultipleData,SIMD)并行计算模式,其具体实现形式包括:协处理器、通用图像处理器以及阵列处理机等。然而

4、,现有并行计算资源在兼容性和可扩展性等方面存在缺陷。本文基于现有异构多核SIMD阵列架构,通过改进多核计算与核内硬件多线程调度机制,提升了系统并行度。并基于所构建的高层模型对SIMD阵列的硬件多线程模块、片内缓存模块和二级缓存模块进行了性能评估,量化分析上述组件对性能的影响。本文利用和改进现有MV5的高层SIMD阵列模型,完成对SIMD阵列核内硬件线程调度策略、cache层次等微结构的设计空间探索。首先,本文在介绍SIMD计算模式及相关技术的基础上,通过比对分析梳理出通用图形处理器及向量处理器等并行计算架构与SIMD阵列架构的异同;其次,

5、深入分析和研究现有的MV5的高层SIMD阵列模型,基于对应用程序访存行为的研究,指出多种先进batch调度策略无法显著提升性能,并通过实现基于FIFO的简单调度策略以及大量实验验证了先进调度策略无法提升性能:最后,本文通过对SIMD核心数目、SIMD硬件多线程模块、片内缓存和二级缓存等模块进行架构探索,对关键参数进行探索,并指出微结构对性能构成的影响。本文比对了S1MD阵列在单核到八核配置下的性能,探讨多核架构最高效率比的内核数量配置,比对系统在不同线程组织策略下的执行效率,得到最优化的硬件线程组织方案。本文基于事件驱动仿真平台MV5进行

6、实验,结果表明:与其它先进batch调度策略相比,本文提出的FIFO调度策略能够保持相同性能;基于对不同类型测试用例的设计空间探索,本文认为在所选测试程序下,把线程组的线程数配置为4时,系统达到最优性能;内核数量为4时,SIMD阵列的收益最大;片内缓存与二级缓存分别配置为32KB和4MB,即可充分满足应用对片上存储的需求。关键词:SIMD阵列,异构多核,缓存架构,高层模型,MV5万方数据AbstractThecurrentcomputersystemwidelyintroduceson-chiporoff-chipcomputingres

7、ources,whichusesSingleInstructionMultipleData(SIMD)parallelcomputationparadigmcanexcavatedataparallelism.Therealizingformincludesthecoprocessor,generalimageprocessorandarrayprocessonHowever,theseexistingresourceshavedefectsincompatibilityandexpansibility.Onthebasisofexist

8、ingheterogeneousmulti--coreSIMDarrayarchitecture;thisthesisimprovesmulti·-corecomputeandthehardw

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。