Linux 0.12内核与现代内核在内存管理上的区别

0.12内核的内存管理比较简单粗暴,内核只用了一个页目录,只能映射4G的线性空间,所以每个进程的虚拟空间(逻辑空间)只能给到64M,最多64个进程;每个进程都有对应的任务号nr,当一个进程需要分配进程空间时,只需要nr乘以64M就可以得出该进程空间的线性起始地址。然后该进程的代码段、数据段描述符里面的基址字段会被设定为(nr x 64M),同时可以为进程分配页目录项和页目录表用以承载映射关系。
之后如果进程要访问自己空间内的某个地址时就会首先用基地址与程序内32位偏移地址(逻辑地址)合成出线性地址,这个合成出来的线性地址一定在(段基址)~(段基址+段限长)之间,也就是(nr x 64M ~ nr x 64M+64M)之间。然后用这个线性地址遵循:“页目录项-页表-页表表项”这样的顺序找到对应的页表表项,也就找到了物理地址,就可以真正的存取数据了。

但是在现代内核里,内存管理有很多不同。
首先,线性地址空间不会改变,32位CPU可寻址4G线性空间。这个是唯一的。
但是每个进程都有自己各自独立的4G虚拟空间,那么这是如何做到的呢?其实是每个进程给它一个自己的页目录,这样每个进程就能拥有4G的虚拟空间(逻辑空间)了。
注意:0.12内核两个进程各自合成出的线性地址一定不相同,因为每个进程占据线性空间的不同区域。但是现代内核里,A、B两个进程可能合成出相同的线性地址,因为每个进程都有4G的虚拟空间,也就是说虚拟空间和线性空间对等了。但是由于两个进程的页目录和页表都不同,所以这两个进程会把各自合成出的数值相等的线性地址,映射到不同的物理地址。也就是两者线性空间到物理空间的映射是不同的。换句话说在现代内核里,虚拟空间(逻辑空间)和线性空间几乎成了一个概念,以下不作区分。

举个例子,即使A和B进程同时访问各自线性空间的0x0804800地址处,分段分页地址变换机制也会把0x0804800这个线性地址映射到不同的物理地址上去。而这个过程,进程自己是看不到的,A和B都认为自己成功访问了0x0804800这个地址,但是实际上,他们访问的是各自线性空间里“数值相等的”线性地址,最终这两个“数值上相等”的线性地址将映射到不同的的物理内存地址处。这就实现了进程隔离。
每个进程都具备4G的线性空间(虚拟空间),进程的线性空间之间相互隔离,互不干涉,每个进程都在自己的世界里干活。

上面说的都是从操作系统原理的角度说的,放到具体的Linux操作系统上会有点不同。因为Linux内核里面规定,虽然每个进程各自拥有4G的线性空间,但是他们并不能随意使用这全部的4个G。0-3G是用户空间,的确是可以自由使用的,但是3G-4G之间内核空间,不能被随意使用。所以,上面的理论可以完善为,每个进程都有一个大小为4G的线性空间,这4G的线性空间分为两部分:
大小为3G的用户空间,各进程在“特权级3级”下可以自由独立使用,各进程的这块空间是完全独立的互不影响的,是指向物理内存不同位置的。
大小为1G的内核空间,各进程在“特权级0级”下才可以使用这块空间,各进程的这块空间不是独立的,是指向同一物理内存位置的。也就是说是所有进程共享的。

Show Comments