欢迎来到天天文库
浏览记录
ID:55603789
大小:1.11 MB
页数:13页
时间:2020-05-20
《选择稀疏矩阵乘法最优存储格式的研究-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、计算机研究与发展7544/issn1OOO—l239.2014.20120857JournalofComputerResearchandDevelopment51(4):882—894,2014选择稀疏矩阵乘法最优存储格式的研究李佳佳。张秀霞。谭光明陈明宇(计算机体系结构国家重点实验室(中国科学院计算技术研究所)北京100190)(中国科学院大学北京100049)(1ijiajia@ict.ac.cn)StudyofChoosingtheOptimalStorageFormatofSparseMatrixVectorMultiplicationIiJiajia”,Zhang
2、Xiuxia,TanGuangming,andChenMingyu(StateKeyLaboratoryofComputerArchitecture(InstituteofComputingTechnology,ChineseAcademyofSciences),Beijing1O0190)(UniversityofChineseAcademyofSciences,Beijing100049)AbstractSparsematrixvectormultiplication(SpMV)isoneofthemostimportantkernelsinscientificande
3、ngineeringapplications.ItisalsooneofthemostessentialsubprogramsofsparseBLASlibrary.AlotofworkhasbeendedicatedinoptimizingSpMV,andsomehasachievedsignificantperformanceimprovement.Sincemostoftheoptimizationmethodsarelessofgeneralizationandonlysuitableforaspecifictypeofsparsematrices,theoptim
4、izedSpMVkernelshavenotbeenwidelyusedinrealapplicationsandnumericalsolvers.Besides,therearemanystorageformatsofasparsematrixandmostofthemachievediverseperformanceondifferentSpMVkernels.Inthispaper,consideringdifferentsparsematrixfeatures,wepresentanSpMVauto—tuner(SMAT)tochoosetheoptimalstor
5、ageformatforagivensparsematrixondifferentcomputerarchitectures.TheoptimalstorageformatreleasingthehighestSpMVperformanceishelpfultoenhancetheperformanceofapplications.Moreover,SMATiSalsoextensibletonewformats,whichwillmakefulluseoftheachievementsofSpMVoptimizationinliteratures.WetestSMATus
6、ing2366sparsematricesfromtheUniversityofFlorida.SMATachieves9.11GFLOPS(single)and2.44GFLOPS(double)onInte1platform,and3.36GFLOPS(single)and1.52GFLOPS(double)onAMDplatform.ComparedwithIntelMKLlibrary,thespeedupofSMATis1.4to1.5times.KeywordsSpMV;auto—tuning;numericalsolver;sparsematrix;SpBLA
7、S摘要稀疏矩阵向量乘法(sparsematrixvectormultiplication,SpMV)是科学和工程领域中重要的核心子程序之一,也是稀疏基本线性代数子程序(basic1inearalgebrasubprograms,BLAS)库的重要函数.目前很多SpMV的优化工作在不同程度上获得了性能提升,但大多数优化工作针对特定存储格式或一类具有特定特征的稀疏矩阵缺乏通用性.因此高性能的SpMV实现并没有广泛地应用于实际应用和数值解法器中.另外,稀疏矩阵具有众多存储格式,不同存储格式的SpMV存在较大性能差异.根据
此文档下载收益归作者所有