基于MIC的CLCG4并行化设计与实现-论文.pdf

基于MIC的CLCG4并行化设计与实现-论文.pdf

ID:53028613

大小:293.57 KB

页数:4页

时间:2020-04-14

基于MIC的CLCG4并行化设计与实现-论文.pdf_第1页
基于MIC的CLCG4并行化设计与实现-论文.pdf_第2页
基于MIC的CLCG4并行化设计与实现-论文.pdf_第3页
基于MIC的CLCG4并行化设计与实现-论文.pdf_第4页
资源描述:

《基于MIC的CLCG4并行化设计与实现-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、a叶技2015年第28卷第7期协议·算法及仿真ElectronicSci.&Tech./July.15.2015doi:10.16180/j.cnki.issnl007—7820.2015.07.031基于MlC的CLCG4并行化设计与实现李智杰,周津羽,华诚,刘逍r,周晓辉(1.西安邮电大学计算机学院,陕西西安710061;2.陕西省高性能计算研究中心,陕西西安710061)摘要CLCG4是线性同余随机数发生器中的一种,因其周期长且随机性好被广为应用,但其缺点是产生随机数速度较慢的问题。针对这一问

2、题文中通过CLCG4串行算法,设计实现了其并行化的方法,并对结果进行对比测试,使其速度得到了明显的提升。实验结果显示,并行化后的CLCG4相对于原CLCG4发生器,在MIC平台下的最高加速比达到6.82。关键词随机数发生器;CLCG4;并行化;MIC中图分类号TP311.52文献标识码A文章编号1007—7820(2015)07—101—04ImplementationandPerformanceAnalysisofCLCG4ParallelizationBasedonMICLIZhijie,ZHO

3、UJinyu,HUACheng,LIUXiao,ZHOUXiaohui,(1.SchoolofComputerScience&Technology,Xi’allUniversityofPosts&Telecommunications,Xi’an710061,China;2.ShaanxiResearchCenterforHighPerformanceComputing,Xi’an710061,China)AbstractTheCLCG4generatorisakindoffeedbackshiftr

4、andomnumbergeneratorthathaswideapplicationf0ritslongperiodandgoodrandomness.butwithlowspeedingeneratingrandomnumbers.AparallelalgorithmisdesignedandimplementedbasedontheCLCG4serialalgorithm.ExperimentalresultsshowthattheparallelizedCLCG4generatorhasasi

5、gnificantincreaseinspeedoverthesingle-threadwiththeCPUontheMICplatformwithaspeeduprateofupto6.82.Keywordsrandomnumbergenerator;CLCG4;parallelization;MIC能够产生随机数序列的软件或硬件或者二者的结来发展的一个方向重要,其在提高计算机硬件资源利合被称为随机数发生器(RandomNumberGenerator,用率的同时,可显著改善算法的性能、程序的执行速

6、度RNG)-2]。随着计算机技术的发展,随机数发生器在等。近年来,并行化技术已开始应用于随机数发生器各个领域得到了越来越广泛应用。LCG是目前主流随领域,BradleyT,duToitJ和GilesM等人在2010机数发生器中的一种,其优点是随机性好、产生速度快年将随机数发生器的并行化方法归纳为SimpleSkip等,但周期较短。因此,如何提高随机数发生器的品质Ahead,StridedSkipAhead和Hybrid3种J。但针对每及其发生速度成为研究热点,人们提出了组合随机数一类随机数发生器具体

7、的使用方法、并行化实施方案、发生器的思想I4J。L'Ecuyer和Andres于1997年提并行化效果并没有进行阐述和说明。出的CLCG4是其中一种,通过将4个LCG发生器本文就CLCG4运行速度缓慢的问题,在前人工作组合能够克服LCG发生器周期较短的缺点。然而由的基础上利用SimpleSkipAhead方法实现了CLCG4于CLCG4算法复杂度的增加,使其产生随机数的速率的并行化,并基于MIC进行了性能测试分析,主要思较慢。想是通过在一个周期内划分线程和分配任务,每个线现今计算机的发展可分为两个阶

8、段:串行计算时程独立的产生一段周期内的随机数的子序列达到并代和并行计算时代J。随着基于多核处理器结构的计行化。本文研究的主要内容包括对于CLCG4串行算算机成为市场的主流,并行计算将会是计算机科学未法的研究和并行算法的设计;CPU平台下并行程序的开发及性能测试;MIC平台上的移植及性能测试;通过目前最为完备的随机数发生器测试库TestU01进行收稿日期:2014.12.03随机数性能测试,以此来保证并检验并行化过程的正基金项目:陕西省自然科学基金研究计划资助项目(20

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。