一种基于事务存储模型的多核结构上编程模型设计和实现

一种基于事务存储模型的多核结构上编程模型设计和实现

ID:39137547

大小:2.22 MB

页数:60页

时间:2019-06-25

一种基于事务存储模型的多核结构上编程模型设计和实现_第1页
一种基于事务存储模型的多核结构上编程模型设计和实现_第2页
一种基于事务存储模型的多核结构上编程模型设计和实现_第3页
一种基于事务存储模型的多核结构上编程模型设计和实现_第4页
一种基于事务存储模型的多核结构上编程模型设计和实现_第5页
资源描述:

《一种基于事务存储模型的多核结构上编程模型设计和实现》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、中国科学技术大学工学硕士学位论文whileitmaintainsthesimplicityofparallelprogramming.Inaddition,weidentifyafewimportantfactorsaffectingtheperformanceofTMprogrammingmodelandproposeourfutureresearchdirections.KeywordsChipMultiprocessorArchitecture;ParallelProgrammingModel;TransactionalMemory;Aut

2、omaticParallelization..III..中国科学技术大学工学硕士学位论文图目录图2.1并行结构层次抽象⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.6图2.2OpenMP层次抽象⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯6图2—3共享地址空间系统⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.8图2—4消息传递系统⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.8图2.5处理器间同步实例⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.9图2-6利用load/store完成的同步操作⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.10图2.7几种一致性协议对序的限制⋯

3、⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯11图2.8事务存储模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯15图2.9UTM模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..17图2.10TTM抽象层次接口⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.19图2.11VTM的软/硬件结合方案⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯20图3.1TMCMS单个节点结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.23图3.2StartLoop指令用法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯25图3.3TerminateLoop指令用法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..26

4、图3—4TMCMS结构硬件层次和软/硬件接口⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯30图4.1循环结构编程模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯32图4.2多线程结构编程模型】...⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯32图4.3循环结构编程模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯33图4.4子程序调用执行模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯35图4.5多线程结构执行模型⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯36图4-6针对循环结构的编译转化⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯39图4.7TMCMS结构地址空间⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

5、.40图4.8子程序调用编译转化⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯43图4-9静态和动态XIT组织方式⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..44图4.10FFT程序中的三层循环结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..47图4.11编译转化后的结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.48图4.12全局化结构体和封装函数的使用⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.49图4.13语言结构和用户/系统接口的对应关系⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯52图5.1处理单元个数和IPC的关系⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯55图5.2软件开销⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯

6、⋯⋯⋯⋯⋯⋯56中国科学技术大学工学硕士学位论文1.1课题研究背景第1章绪论1.1.1指令集并行性的限制集成电路技术的发展大大增加了芯片集成的密度,在几年中,一个芯片上集成的晶体管数目可能达到10亿个。为了有效的利用它,必须有效开发程序的并行性提高芯片的利用率。传统的处理器一般依赖单线程上提取指令级并行。l生(ILP),但是在单线程上提取ILP越来越难。提取ILP的方法是利用芯片中额外增加的晶体管资源从单个串行的指令队列中寻找更多可以并行执行的指令,提高每个时钟周期的并行度,从而提高机器的性能。开发指令级并行性的最常用的方法是超标量技术、超长指令

7、字和超流水技术。超标量技术通过动态的提取无关的指令,隐藏因为访存延迟、控g,l*N关、数据依赖带来的延迟,对于它来说,更大的发射宽度和指令窗口意味着更高的性能。超长指令字技术是利用编译器静态提取可以同时发射的指令,虽然编译器提供了无限大的指令窗口,但是更大的发射宽度依然需要由硬件提供。超流水技术通过将一个流水段拆分为几个流水段,让每个流水段尽量做更少的事情,从而通过提高芯片时钟频率的方法来提高处理器的性能。但是这也加深了流水线深度,分支预测错误代价因为流水线刷新的代价变大而增加。但是现在通过超标量技术、超长指令字和超流水技术开发指令集并行性越来越

8、困难。访存延迟,控制相关和数据依赖造成了长的延迟、降低了指令之间并行度,从而使一个线程不足以提供足够的指令。这使得开发指令集并行性越来越

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。