欢迎来到天天文库
浏览记录
ID:41060657
大小:676.24 KB
页数:29页
时间:2019-08-15
《mossefshadooplusterpanasas分布存储》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、Linux文件系统演示主要内容:LinuxvfsLinux(ext2)文件访问机制Linux(ext3)日志功能Linux文件系统(ext2/ext3)数据不一致的处理认识几种分布式文件系统虚拟文件系统为了支持其他各种不同的文件系统,Linux提供了一种统一的框架,就是所谓的虚拟文件系统转换(VirtualFilesystemSwitch),简称虚拟文件系统(VFS)。Vfs与文件系统关系逻辑文件系统整个文件系统示意图Inode和数据区??读取/etc/crontab的流程目录/etc的inode文件crontab的inode目录/etc的块区域关联性内容文件/etc/cro
2、ntab的实际内容Inode总结Inode:记录文件的相关属性,以及文件内容放置在哪一个块内。换句话说,inode除了记录文件的属性外,同时还必须要具有指针的功能,Inode记录的一些信息;该文件的拥有者与用户组该文件的访问模式该文件的类型该文件的建立,改变,最近一次读取时间,最近一次的修改时间。该文件的大小该文件的属性标志该文件的真正内容指针。数据与元数据Inode表与块区域成为数据存放区。其他的诸如超级块,块位图与inode位图等记录成为元数据。元数据记录数据(属性)的数据。数据的不一致问题文件写入硬盘时,未知原因导致系统中断,就会发生元数据与数据的不一致情况。如何处理?
3、?EXT2:系统重启时通过超级块记录的有效位与文件系统状态等,判断是否强制进行数据检查。EXT3的日志功能1.系统要写入一个文件的时候,先在日志块中记录:某个文件要写入磁盘了。2.开始写入文件的权限与数据。3.开始更新元数据的数据。4.完成数据与元数据的更新后,在日志记录块中完成该文件的记录。使用日志文件系统好处文件的安全提高了,文件被破坏的机率降低了,对磁盘的扫描时间缩短了,扫描次数减少了。当系统意外宕机后,不会再有文件内容的丢失,至少文件应该保持上一个版本的内容;采用日志文件系统,通常系统每重新启动20-30次后,才会对磁盘进行一次整体扫描,扫描次数减少了。日志增加了文件
4、操作的时间,但是,从文件安全性角度出发,磁盘文件的安全性得到了重大的提高。网友对日志文件系统进行了测试,日志文件系统的性能并不比ext2文件系统有太大的性能损失,有的日志文件系统由于采用B+树算法,在操作一些大尺寸的文件时,性能反面比非日志文件系统的性能还要好。什么是分布式文件系统数据、文件分散存储到不同的物理设备文件、数据被块文件读写并行低成本Hadoop是什么Hadoop:一个基于MapReduce的相当成功的分布式计算平台MapReduce的思想是由Google的一篇论文所提及而被广为流传的,简单的一句话解释MapReduce就是任务的分解与结合的汇总。MapRecuc
5、e可以将被划分成多个小的Block的海量检索数据以分布式的方法局部计算,并应用Map将他们映射到一个提供Reduce的中心上。从而达到快速处理海量数据检索的目的。然而Map和Reduce不仅仅只是可以检索,事实上修改MapReduce的部分细节,就可以利用MapReduce实现更广泛的应用。hadoop三个子项目Hadoopcore提供分布式文件系统HDFS,支持MapReduce分布式计算,组建大型集群。Hadoop框架中最核心设计就是:MapReduce和HDFS。(MapReduce的思想是由Google的一篇论文所提及而被广为流传的,简单的一句话解释MapReduce
6、就是任务的分解与结果的汇总。HDFS是Hadoop分布式文件系统的缩写,为分布式计算存储提供了底层支持)Hbase类似Google的BigTable,是hadoop的数据库。(HBase使用和Bigtable非常相同的数据模型.用户存储数据行在一个表里.一个数据行拥有一个可选择的键和任意数量的列.表是疏松的存储的,因此用户可以给行定义各种不同的列。)ZookeeperZookeeper高可用和具有可靠的协调机制,分布式应用使用它来存储和协调。Zookeeper是Google的Chubby一个开源的实现.是高有效和可靠的协同工作系统.Zookeeper能够用来leader选举,
7、配置信息维护等.在一个分布式的环境中,我们需要一个Master实例或存储一些配置信息,确保文件写入的一致性等.HDFS、MapReduce和HBase三者相辅相成、各有长处HDFS-最大化利用磁盘MapReduce-最大化利用CPUHBase-最大化利用内存MapReduce和HBase都将数据存储在HDFS,而且HBase还利用了MapReduce的计算能力。而Pig和Hive则为更高层的建筑,降低了使用Hadoop的门槛,提高了Hadoop开发的效率。ZooKeeper和Com-mon成员可以说是地
此文档下载收益归作者所有