欢迎来到天天文库
浏览记录
ID:34126546
大小:10.73 MB
页数:105页
时间:2019-03-03
《基于超大规模异构体系结构的图计算系统研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于超大规模异构体系结构的图计算系统研究(申请清华大学工学博士学位论文)培养单位:计算机科学与技术系学科:计算机科学与技术研究生:林恒指导教师:郑纬民教授一二■〇七年十二月G-rahanalsisonextremescalepyheterogeneousarchitectureDissertationSubmittedtoTsinhuaUniversitgyinartialfulfillmentofthereuirementp
2、qforthedereeofgDoctorofEnineeringgbyHenLing(ComputerScienceandTechnology)DissertationSuervisor:ProfessorZhenWeiminpgDecember2017,摘要摘要图数据有着强大的表达能力,适用的领域包括社交网络、生物信息、网页搜索和运输系统等。图计算系统是处理图数据的强有力工具,目前公开的图计算系统已经能在数百台机器上处理上
3、万亿条边的图数据。然而现实生活中的图数据规模2017。高速增长,比如中文网页图的链接数在年初达到了十万亿规模庞大的图数据规模,结合其数据依赖、幂律分布的特点,给图计算系统的硬件和软件均提出了更加严峻的挑战。本文主要的研究对象为超大规模图计算系统,采用的硬件平台为目前(2017?一—?10月)世界上T〇500排名第的超级计算机神威太湖之光年P。在本平台一个典型的图计算应用入手上,本文先从,研究了宽度优先搜索算法,接着扩展为更一一般的图计算框架,进步研究超大规模图计算问题。?
4、W21.超大规模宽度优先搜索算法太湖之光的处理器S6010的异。针对神威构体系结构,提出了从核无锁数据分发技术,避免了原子操作给加速核带来的开销,充分利用了内存带宽。同时提出了流水化的功能映射技术,让加速核处理核心执行任务,发挥其高访存带宽的特点,而将繁琐的任务调度和通信任务交给通用核。针对超大规模网络环境下的不定长小消息问题,提出了基于分组的消息聚类技术,分两个阶段聚合发送消息,在4万节点时将消息数量降低了两个数量级。2—.神图超大规模图计算框架。相对于宽度优先遍历算法,其
5、他图算法通常会有更多的通信消息和数据操作的原子性要求。神图提出了分化的消息传输技术,通过将图数据的边按照顶点出入度的不同分为互不相交的三类,分别。采用最优的方法来处理,以减少通信的消息量和提高负载均衡针对数据更新操作的原子性,神图采用基于推送的顶点状态更新技术,分为两个阶段来解决数据过于离散访问的特性。通过以上两方面的研究,本文宽度优先搜索算法的实现在标准评测程序3h[]2Grap500的规范下,达到了3755.7GTEPS,成果在2016年11月的排行榜一二。上排名
6、设备第、全榜第神图同时在真实数据和生成数据上进行了结果验证和性能分析12PaeRank21,在万亿边的搜狗中文网页链接图上每轮g的时间仅为秒。关键词:异构体系结构;超级计算机;图计算;高性能IAbstractAbstractGraphisapowerfuldatastructuretopresentdatainmanyareas,suchassocialnetworkbioloinformationwebaerankinandtransor
7、tsstem.Grahrocessin,gy,pggpyppgsstemisdesignedtorocessrahdataefficientl.Howeverthesizeofrahsrowstooypgpy,gpgfasttobehandledbyresentrahrocessinenines.Forexamle,theedenumberofpgppggpgChinesewebrahhasexceededten
8、trillionattheearl2017.Grahsthatareextremelgpypylargeoseareatchallenetorahrocessineninesintermsofbothhardwareandpgggppgg,software.Wtt-lhibleminthitheisesudyexremescaegrapprocessngprosss.
此文档下载收益归作者所有