欢迎来到天天文库
浏览记录
ID:34525182
大小:3.60 MB
页数:51页
时间:2019-03-07
《云计算与云数据管理new》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、云数据管理技术与挑战陆嘉恒中国人民大学www.jiahenglu.net主要内容ó云计算与云数据管理概述ó各大公司的云数据管理技术ó人民大学研究团队的工作ó云数据管理的研究挑战2云数据管理的新思维云数据管理准则(1)•PartitionEverythingandkey‐valuestorage•切分万物以治之•数据库的第一范式无法满足云数据管理准则(2)•EmbraceInconsistency•容不同乃成大同•数据库的ACID的属性无法满足云数据管理准则(3)•Backupeverythingwiththreecopies•狡兔三
2、窟方高枕•每个数据都有三个备份,达到99.999999%的保障度云数据管理准则(4)•Scalableandhighperformance•运筹沧海量兼容•提供一个可伸缩的,处理和分析海量数据的平台拨云见日•切分万物以治之•容不同乃成大同•狡兔三窟方高枕•运筹沧海量兼容主要内容ó云计算与云数据管理概述ó各大公司的云数据管理技术ó人民大学研究团队的工作ó云数据管理的研究挑战11主要内容Google文件系统(GFS)•适用于大规模数据密集型应用程序的可扩展分布式文件系统•多个部署GFS的集群已经建成•目前最大的集群为:–10000多个存
3、储节点–300+PB的存储容量–可供不同机器上的上百用户同时读取介绍:观察1•控件的故障时常发生–系统集成了实时监控、错误检测、容错性和自动恢复等功能•超大文件(与普通文件相比)–GB大小的文件很正常介绍:观察2•大部分文件修改都是添加新的内容–需要考虑优化性能和保证原子性•协同设计应用程序和API有利于增加整个系统的灵活性设计•集群包含一个master和多个chunkservers,并且可供多个用户读取GAEWeb应用GoogleAppEngine应用程序运行分布式存储服务应用开发套件管理控制台时环境GAEWeb服务基础设施分布式
4、存储服务•GAE提供的分布式存储服务基于BigTable技术•通过JavaJDO/JPA接口或Python数据库标准接口访问和操作数据库•优势:成本低、支持伸缩、并发性好、易管理•采用乐观的并发控制应用程序运行时环境•GAE的应用程序运行时环境是一个可伸缩的Web程序运行平台•目前支持Python和Java•可以使用Google提供的丰富的应用服务,如分布式存储服务、网页抓取、邮件、图像、Google账户等云端应用•GoogleDocs是基于Web的文字处理和电子表格程序,支持在线协作、文档恢复、文档检索•Gmail是有效的电子邮件
5、工具,支持即时消息、视频聊天、会话检索等IBMIBMTSAMEnsemblesIBMWebSphereCloudBurstIBMLotusLive云环境管理解决方案IBMRC2IBMTSAM•IBMTivoliServiceAutomationManager(TSAM)•管理应用服务生命周期的方案IBMWebSphereCloudBurst•IBMWebSphereCloudBurstApplication(WCA)•帮助用户创建和管理面向服务的私有云平台•有效整合了云基础设施层和云平台层数据中心管理员应用系统Web控制台CRMER
6、P网上…系统系统银行基础设施管理虚拟化解决方案部署SOA环境用户合格组管理虚拟器件镜像模板管理WebSphereWebSphere管理WebSphereApplicationProcessDB2PorialServerServer监控、审计和计费脚本包管理数据中心资源WebSphereCloudburstApplianceIBMLotusLive•通过Web方式交付的服务•会议服务–LotusLiveMeetings–LotusLiveEvents•办公协作服务–LotusLiveEngage–LotusLiveConnection
7、s•电子邮件服务–LotusLiveNotesIBMRC2•IBMResearchComputeCloud阿尔玛登苏黎世纽约北京海法东京奥斯丁新德里AmazonAmazonEC2SimpleDBAmazonS3AmazonSQSAmazonWebServiceAmazonS3•AmazonSimpleStorageService(S3)•云计算平台提供的可靠的网络存储服务•通过互联网访问和管理•安全性–账户认证–访问控制列表–查询字符串认证•可靠性–冗余备份的存储机制AmazonSimpleDB•AmazonSimpleDB是一种支
8、持结构化数据存储和查询操作的轻量级数据库服务•存储模型:域(Domain)、项(Item)、属性(Attribute)•现有不足–延迟较大–不能保证顺序执行用户更新–与关系型数据库兼容有限AmazonEC2•AmazonEC2是一种云
此文档下载收益归作者所有