操作系统虚拟化底层基础之命名空间(namespace)

操作系统虚拟化底层基础之命名空间(namespace)

ID:5845743

大小:7.32 MB

页数:15页

时间:2017-12-26

操作系统虚拟化底层基础之命名空间(namespace)_第1页
操作系统虚拟化底层基础之命名空间(namespace)_第2页
操作系统虚拟化底层基础之命名空间(namespace)_第3页
操作系统虚拟化底层基础之命名空间(namespace)_第4页
操作系统虚拟化底层基础之命名空间(namespace)_第5页
资源描述:

《操作系统虚拟化底层基础之命名空间(namespace)》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、操作系统虚拟化底层基础之命名空间(namespace)黎润(yijunzhu@qq.com)目录背景2总览2UTS命名空间子模块3IPC命名空间子模块5MNT命名空间子模块6PID命名空间子模块8NET命名空间子模块11总结15背景随着公司业务的迅猛发展,大量的机器在线上业务号召下投入了服务于广大网民的神圣职责。不过基于一个不完全统计,我们公司的线上机器平均利用率20%左右,这就意味着70%左右的机器都是可回收或者复用的。出于节约机器,统一管理以及在线迁移的初衷,我们进行了虚拟化计算的研究。经过选型测试以及具体应用场景的研究,我们

2、选择了操作系统虚拟化技术,即LXC。(为什么选择LXC,OpenVZ如何?Xen效果如何等等这些问题请参考其他文档,本文主要讨论LXC的底层实现技术)。LXC本身不是一个具体的技术,它是一个集合技术的代称,我们可以总体上来看,LXC主要有namespace和cgroup两大模块构建而成,本系列主要就是说说这两个技术,本文则专注于namespace。在我们讲述具体的技术之前,先来看看容器模块的整个状态系统,目前主要是IBM,google等公司的团队在负责维护更新。目前container已经被上有内核所接纳,所以不存在自己维护分支版本

3、的问题。但是这些团队之间合作不是我们想象的和谐,不同利益集团之间是有内核的政治诉求,都想把自家的内容扶位正房,导致我们再看操作系统虚拟化的时候会有不同项目博弈的事迹。总览每一个进程其所包含的命名空间都被抽象层一个nsproxy指针,共享同一个命名空间的进程指向同一个指针,指针的结构通过引用计数(count)来确定使用者数目。当一个进程其所处的用户空间发生变化的时候就发生分裂。通过复制一份老的命名空间数据结构,然后做一些简单的修改,接着赋值给相应的进程。看了上面的数据结构,我们就会基本明白,命名空间本身只是一个框架,需要其他实行虚拟

4、化的子系统实现自己的命名空间。这些子系统的对象就不再是全局维护的一份结构了,而是和进程的用户空间数目一致,每一个命名空间都会有对象的一个具体实例。目前Linux系统实现的命名空间子系统主要有UTS、IPC、MNT、PID以及NET网络子模块。我们在下文会针对这些子模块进行进一步的分析。UTS命名空间子模块UTS相对而言是一个简单的扁平化命名空间子模块,其不同的命名空间之间没有层次关系。我们先来看一下UTS的数据结构。New_utename结构里面就是我们通过uname–a能够看到的信息。看一下机器上的输出:我通过红色斜线把unam

5、e–a的输出分隔开,分别对应上面的new_utsname的结构体。另外内核还把这些信息也通过proc文件系统导出,我们可以通过/proc/sys/kernel目录里面的如下等变量(Ostype/hostname/osrelease/version)查看,当然这些变量的值也是可以更改的。初始的时候,系统默认构造了一个UTS结构,他的值分别如下所述。当一个新的命名空间创建的时候,copy_utsname会被调用来创建一个UTS的命名空间,主要工作在clone_uts_ns函数里面完成。上面讲述了UTS的代码表示,我们再来只管看一下UT

6、SNamespace和Kref配合使用的场景。上述顺序描述了ustname在容器里面的局部化以及和引用计数配合完成的对象生命周期管理。IPC命名空间子模块IPC作为一个常见的进程间通信工具,命名空间对他也进行了部分支持。另外IPC也是一个较为简单的扁平化进程间通信工具,命名空间之间不存在层级。上面罗列的主要是IPC命名空间里面包含的元素,各个命名空间之间的关系是并列的。……IPCNamespaceIPCNamespaceIPCNamespace……NSProxyNSProxy我们直观的给一个图描述资源隔离使用概念图。属于不同命名空

7、间的进程之间是不能访问对方的全局资源的,这儿展示的主要是IPC的SHM,MSG以及SEM,在较新的代码里MQueue也可以被隔离。MNT命名空间子模块虚拟机的一个核心功能就是完成应用的隔离,即业务之间相互不可见。这一块主要通过文件系统的视图来完成,进程创建的时候,每一个进程都有自己的文件挂节点信息。看一下经典的structtask_struct.在一个系统启动的时候,0号进程就设置好了自己所在的根目录以及当前目录。在创建子进程的时候,通过CLONE_FS来指明父子之间的共享信息,如果设置了两者共享同一个结构(指针加上引用计数),没

8、有设置标记的话,子进程创建一个新的拷贝,两者之间互不影响。如果设置了CLONE_FS,接下来通过chroot(2),chdir(2),orumask(2)的调用结果两者之间会相互影响,反之两者是独立的。下面这张图清晰明了的刻画了进程内部的文件系统信

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。