欢迎来到天天文库
浏览记录
ID:53567960
大小:450.57 KB
页数:7页
时间:2020-04-18
《多处理部件并行优化方法研究-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、第40卷第9期计算机工程2014年9月Vo1.40NO.9ComputerEngineeringSeptember2014·开发研究与工程应用·文章编号:1000-3428(2014)09-0305-07文献标识码:A中图分类号:TP316多处理部件并行优化方法研究李钊,郑红(北京航空航天大学自动化科学与电气工程学院,北京100191)摘要:针对多处理单元(PE)并行优化中运行时间和资源消耗随PE数量变化而增加的问题,分析多PE并行中运行时间和资源消耗随PE数量的变化规律,建立基于运行时间和资源消耗的优化目标函数,并从理论上证明优化目标函数最小值的存在性和唯一性,提出基于运行时间与资源消耗
2、的多PE并行优化方法。该优化方法可在最小资源消耗的情况下实现运行时间的最优化。利用灰度共生矩阵和单精度浮点矩阵乘法的多PE优化方法进行验证。实验结果表明,多PE并行的优化方法实现了运行时间和资源消耗的优化,在运行时间上该方法比已有方法最高快6.79倍,在运行时间和资源消耗的综合对比上该方法最高为已有方法的3.3倍,能够实现基于运行时间和资源消耗的优化。关键词:多处理单元并行;优化方法;运行时间;资源消耗;灰度共生矩阵;单精度浮点矩阵乘法ResearchonOptimizationMethodofMultipleProcessingElementParallelizati0nLIZhao,Z
3、HENGHong(SchoolofAutomationScienceandElectricalEngineering,BeihangUniversity,Beijing100191,China)【Abstract】ThechangingofruntimeandresourceconsumptionwiththenumberoftheProcessingElement(PE)iscontrary.TherulesofruntimeandresourceconsumptionwiththenumberofPEareanalyzed.Andthevariationtrendforresource
4、consumptionandruntimewiththenumberofPEisgot.Theoptimizationobjectivefunctionbasedonruntimeandresourceconsumptionisestablished.Theexistenceanduniquenessoftheminimumforoptimizationobjectivefunctionareproved.Themulti·PEoptimizationmethodbasedonruntimeandresourceconsumptionisproposed.Thismethodcanreal
5、izetheruntimeoptimizationwiththeleastresourceconsumption.Inordertovalidatethemethod,theoptimaldesignofthecalculationofthegraylevelCO-occurrencematrixandsinglefloatmatrixmultiplicationareproposed.ExperimentalresultsindicatethattheruntimeofgraylevelCO—occurrencematrixisatmost6.79timesthantheoldmetho
6、d.Theintegratedresultaboutruntimeandareaconsumptionis3.3timesthantheoldmethod.Theoptimizationofruntimeandareaconsumptionisimplemented.【Keywords】multipleProcessingElement(PE)inparallel;optimizationmethod;runtime;areaconsumption;graylevelCO-occurencematrix;singlefloatmatrixmultiplicationDOI:10.3969/
7、j.issn.1000—3428.2014.09.061根据待处理算法的不同设计不同的PE,以实现特定1概述的功能,PE与PE之间可以并行执行,以提高算法实多处理单元(ProcessingElement,PE)是一个能时性。目前,设计多个PE并行的计算结构实现算法实现特定功能的处理单元,在不同的硬件平台上PE的并行计算,在信号处理和图像处理等领域得到广具有不同的表现形式,例如在通用并行硬件平台上泛应用。一个PE可以是一台
此文档下载收益归作者所有