阿里大数据计算服务MaxCompute-图像模型D

阿里大数据计算服务MaxCompute-图像模型D

ID:35885549

大小:595.50 KB

页数:71页

时间:2019-04-22

阿里大数据计算服务MaxCompute-图像模型D_第1页
阿里大数据计算服务MaxCompute-图像模型D_第2页
阿里大数据计算服务MaxCompute-图像模型D_第3页
阿里大数据计算服务MaxCompute-图像模型D_第4页
阿里大数据计算服务MaxCompute-图像模型D_第5页
资源描述:

《阿里大数据计算服务MaxCompute-图像模型D》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、大数据计算服务MaxCompute图模型大数据计算服务MaxCompute/图模型图模型MaxComputeGRAPH是一套面向迭代的图计算处理框架。图计算作业使用图进行建模,图由点(Vertex)和边(Edge)组成,点和边包含权值(Value),MaxComputeGRAPH支持下述图编辑操作:-修改点或边的权值;-增加/删除点;-增加/删除边;70大数据计算服务MaxCompute/图模型备注:-编辑点和边时,点与边的关系需要用户维护。-目前,Graph功能仍处于公测中,想使用这部分功能的用

2、户可以通过工单系统提交申请。申请时请指明您的项目空间名称,我们会在7个工作日内处理。70大数据计算服务MaxCompute/图模型通过迭代对图进行编辑、演化,最终求解出结果,典型应用:PageRank,单源最短距离算法,K-均值聚类算法等等。用户可以使用MaxComputeGRAPH提供的接口JavaSDK编写图计算程序。Graph数据结构MaxComputeGRAPH能够处理的图必须是是一个由点(Vertex)和边(Edge)组成的有向图。由于MaxCompute仅提供二维表的存储结构,因此需要用

3、户自行将图数据分解为二维表格式存储在MaxCompute中,在进行图计算分析时,使用自定义的GraphLoader将二维表数据转换为MaxComputeGraph引擎中的点和边。至于如何将图数据分解为二维表格式,用户可以根据各自的业务场景做决定。在示例程序中,我们给出的示例分别使用不同的表格式来表达图的数据结构,仅供大家参考。点的结构可以简单表示为,分别表示点标识符(ID),权值(Value),状态(Halted,表示是否要停止迭代),出边集合(Edge

4、s,以该点为起始点的所有边列表)。边的结构可以简单表示为,分别表示目标点(DestVertexID)和权值(Value)。例如,上图由下面的点组成:Vertexv0<0,0,false,[<1,5>,<2,10>]>v1<1,5,false,[<2,3>,<3,2>,<5,9>]>v2<2,8,false,[<1,2>,<5,1>]>v3<3,Long.MAX_VALUE,false,[<0,7>,<5,6>]>v

5、5<5,Long.MAX_VALUE,false,[<3,4>]>70大数据计算服务MaxCompute/图模型Graph程序逻辑1.加载图:图加载:框架调用用户自定义的GraphLoader将输入表的记录解析为点或边;分布式化:框架调用用户自定义的Partitioner对点进行分片(默认分片逻辑:点ID哈希值然后对Worker数取模),分配到相应的Worker;例如,上图假设Worker数是2,那么v0,v2会被分配到Worker0,因为ID对2取模结果为0,而v1,v3,v5将被分配到Worke

6、r1,ID对2取模结果为1;2.迭代计算:-一次迭代为一个"超步"(SuperStep),遍历所有非结束状态(Halted值为false)的点或者收到消息的点(处于结束状态的点收到信息会被自动唤醒),并调用其compute(ComputeContextcontext,Iterablemessages)方法;-在用户实现的compute(ComputeContextcontext,Iterablemessages)方法中:●处理上一个超步发给当前点的消息(Messages);●根据需要对图进行编辑:1

7、).修改点/边的取值;2).发送消息给某些点;3).增加/删除点或边;●通过Aggregator汇总信息到全局信息;●设置当前点状态,结束或非结束状态;●迭代进行过程中,框架会将消息以异步的方式发送到对应Worker并在下一个超步进行处理,用户无需关心;3.迭代终止(满足以下任意一条):-所有点处于结束状态(Halted值为true)且没有新消息产生;-达到最大迭代次数;-某个Aggregator的terminate方法返回true;//1.loadforeachrecordininput_tabl

8、e{GraphLoader.load();}//2.setupWorkerComputer.setup();foreachaggrinaggregators{aggr.createStartupValue();}foreachvinvertices{v.setup();伪代码描述如下:70大数据计算服务MaxCompute/图模型}//3.superstepfor(step=0;step

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。