结构大数据架构26.pdf

结构大数据架构26.pdf

ID:52760323

大小:2.92 MB

页数:26页

时间:2020-03-30

结构大数据架构26.pdf_第1页
结构大数据架构26.pdf_第2页
结构大数据架构26.pdf_第3页
结构大数据架构26.pdf_第4页
结构大数据架构26.pdf_第5页
资源描述:

《结构大数据架构26.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、解構大數據架構大數據系統的伺服器與網路資源規劃“Howtoeatanelephant–onebyteatatime”CPLi李俊邦EnterpriseTechnologistEnterpriseSolutions&Alliances,GreaterChinaDell議程1.不同的伺服器角色1.Manager2.NameNodes3.EdgeNodes4.DataNodes2.HadoopCluster設計3.Etu+Dell4.Futures/Roadmap5.Questions?2ServerRoles-Manager•系統安裝圖形介面/主控台•大多安裝在EdgeNode•常見版本–

2、ClouderaManager–ApacheAmbari3ServerRoles–NameNodes•存放HDFS的metadata•JobManagerforYARNdata-processingframework•Primary–Heartbeatsfromdatanodes–10thheartbeatisablockreportfromwhichitgeneratesmetadata•Standby–Checksineveryhourtomirrormetadata/blockmap–Notahot-spare–requiresmanualfail-over•HighAvaila

3、bility(HA)canbeaddedinsomedistributions–ResultsinadedicatedHAnodethatactsasawitnesstotheNameNodecluster4ServerRoles-EdgeNodes•資料進出Hadoop叢集的主要端口•可擴展•Hadoop叢集裡唯一的多網段節點Corporate NetworkData NetworkData NetworkPowerEdge R730 –Name NodeData NetworkPowerEdge R730 –Standby Name NodeCorporateData Networ

4、kPowerEdge R730 –Edge Node(s)Data NetworkPowerEdge R730 –HA NodeData NetworkPowerEdge R730XD –Data Nodes5ServerRoles-DataNode•HDFS的主要存放處•執行YARN資源管理所指定的資料處理•主要屬性–記憶體›標配64GB›更多服務(Impala/Spark)需要更多記憶體–很多的本地硬碟(JBOD/Non-RAIDmode)›SFF(2.5”)forperformance-basedworkloads›LFF(3.5”)forcapacity-centricwork

5、loads–CPUs–legacyrecommendationof1:1core:spindleratio›SSDs,fasterHDD(10K+),andin-memoryworkloadsmakethislessofanissue›10and12corearethebestpracticedefault6HadoopClusterDesignHadoopClusterDesign–HardwareConsiderations8HadoopClusterDeployment–InstallationBestPractices•Usepre-built,assembled&cabled

6、racksfromvendor•自動佈署工具(ex:OpenCrowbar)•Purchasenodesinstandardsizegroupsforeasycapacitygrowthandordering,notinsinglenodeincrements–Commonincrementsare½orfullrackforeasydeploymentandsizing•Foreachtypeofhardware,purchasesparecomponentstokeeponsiteforeasy,rapidrepair9CoreHadoopUseCases資料處歸檔分析理高硬碟/C

7、PU比高硬碟/CPU比高核心數記憶體使用低記憶體使用中等記憶體使用高DWoffload法規需求ETLoffload市場分析EDH詐欺預防長期歸檔質量分析網路分析ITLog分析10CommonHadoopUseCasetoEcosystemToolMapping11HadoopUseCasetoRatioMapping歸檔資料處理分析1:2:11:4:12:8:1CPU(Cores):Memory(GB):Disk(數量)–DataNode12N

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。