linux-0.11 文件系统


1.简介

文件系统是数据的组织方式,也就是将它们组织的符合一定的格式或者规律,就命名为文件系统了,并不神秘。

linux-0.11 将文件系统分成几个部分,分别为:
超级块,i-node节点位图,块位图,数据块。

先说明几个讲解linux-0.11书籍:

1.linux-0.11内核完全注释
2.linux内核设计的艺术

linux内核设计的艺术写的挺不错的。可以先简单的阅读一遍这本书然后再看linux-0.11内核完全注释,然后再回顾linux内核设计的艺术,那linux-0.11基本上能很好的掌握了。

另外是关于文件系统的相关书籍:
1.minix操作系统设计与实现
2.unix操作系统设计

2.基础知识

先看整个系统的流程框架:


系统执行流程框架

2.1 文件系统结构

文件系统结构

文件系统包含引导块、超级块、i-node位图、逻辑块位图、i节点与数据区等。

2.2 i-node节点

根据文件名获取文件内容步骤:


2.2-1图.从文件名获取文件内容步骤

我来简单说一下寻找文件的步骤:

a.寻找hello.txt文件
由于根目录i节点是确定的,通过这个节点信息可以知道i_size,也就是目录数目,也知道i_zone[9],也就是存放的目录的块的块位置,那么就可以定位到要找的位置,然后就可以通过文件名获取到i节点了,根据i节点也就能定位到hello.txt内容了。

b.寻找/mnt/hello.txt文件
根据上面的步骤,先找到mnt目录的节点,然后找到其目录,获取到大小i_size,如果文件系统是干净的,i_size值应该为3,然后就可以按照上面的a步骤获取到hello.txt了。

总结:还是要多看2.2-1图

2.3 高速缓冲区

先看一下高速缓冲的布局图:


高速缓冲布局

缓冲区结构图:


缓冲区结构图

缓冲区链表结构:


缓冲区链表结构

根据上图,可以从内核中找到在hash数组中找到某一个缓冲头的代码:

static struct buffer_head * find_buffer(int dev, int block)
{       
    struct buffer_head * tmp;

    for (tmp = hash(dev,block) ; tmp != NULL ; tmp = tmp->b_next)
        if (tmp->b_dev==dev && tmp->b_blocknr==block)
            return tmp;
    return NULL;
}

然后是将得到的块插入到free_listhash表中的示意图:

insert_into_queues()函数示意图

3.内核重要函数分析

3.1 内核同步函数

3.1.1 wake_up()sleep_on()

sleep_on()函数是用来等待资源是否可用,如果可用,则该函数退出,否则一直阻塞,最终是阻塞在函数schedule()中。

现在来分析3个进程task1,task2,task3阻塞在同一个资源的情况。

我列出具体工作情况:


image.png

task1在第一次使用资源的时候,tmp=NULL,而当前任务状态为TASK_UNINTERRUPTIBLE,所以schedule()函数不退出。而task2则由于task1tmp=task1,同样task2也被挂住,task3任务也跟task2一样。最终,3个任务由于同一个资源不可用,而全部挂起。

而一旦wake_up()被调用:

void wake_up (struct task_struct **p)
{
    if (p && *p)
    {
        (**p).state = 0;        
        *p = NULL;
    }
}

则首先task3schedule()函数返回,同时task2的任务状态变为可执行,所以task2schedule()也返回,也导致task1的任务状态变为可执行,所以最后task1也返回。

3.1.2 锁lock_buffer()unlock_buffer()

有关锁,只需要注意一件事情就好:
cli ();是清中断许可,sti ();开中断。它们针对的是本进程的EFLAGS寄存器,所以说如果调度到其他进程中,其他进程的EFLAGS是使能的,则它可以接受中断,并能进入中断服务函数的。

展开说一点,从A进程调度到B进程,A进程是关闭中断的,B进程是开启中断的,则在调度到B并执行B之前会加载相应的寄存器,所以EFLAGS被更新,从而是可以被中断的。

3.2 任务调度函数schedule()

看网上都说任务调度函数比较难,但是我看了一下,其实懂一些嵌入式,基本上理解起来不难,只是这个函数比较有技巧。

void schedule (void)
{
    int i, next, c;
    struct task_struct **p; 
    for (p = &LAST_TASK; p > &FIRST_TASK; --p)
        if (*p)
        {
            if ((*p)->alarm && (*p)->alarm < jiffies)
            {
                (*p)->signal |= (1 << (SIGALRM - 1));
                (*p)->alarm = 0;
            }
            if (((*p)->signal & ~(_BLOCKABLE & (*p)->blocked)) &&
                    (*p)->state == TASK_INTERRUPTIBLE)
                (*p)->state = TASK_RUNNING;         
        }
    while (1)
    {
        c = -1;
        next = 0;
        i = NR_TASKS;
        p = &task[NR_TASKS];
        while (--i)
        {
            if (!*--p)
                continue;
            if ((*p)->state == TASK_RUNNING && (*p)->counter > c)
                c = (*p)->counter, next = i;
        }
        if (c)
            break;
        for (p = &LAST_TASK; p > &FIRST_TASK; --p)
            if (*p)
                (*p)->counter = ((*p)->counter >> 1) + (*p)->priority;
    }
    switch_to (next);       
}

调度函数分为2个部分,第一个部分是检查是否有相应的信号,另一个部分则是真正的调度算法。

先说第一个部分。如果设置了定时器值并且系统运行超过了定时值,则需要置位信号位图的SIGALRM值,如果任务可中断,并且设置了除_BLOCKABLE(*p)->blocked的值,则说明任务可以进入执行态。

再说第二个部分。它主要是说任务需要在运行态,才能进行调度。否则就在内核任务0执行。

3.3 复制页表函数copy_page_tables()

这个函数据说也比较复杂。
先看这个函数的参数:
from--->线性地址(逻辑地址)
to--->线性地址(逻辑地址)
size--->页目录数,总共1024个页目录数,但是有效的只有4个。
fromto都需要是4MB对齐。

先来简单回顾一下物理地址是怎么来的。


线性地址到物理地址的转换

fromto的限制要求,可以知道需要拷贝的是按照页目录来拷贝,因为一个页目录项就能指向4096B的页表大小,相当于1024个页表项*4096B=4MB大小。

要注意几项事情:

1.线性地址中的页目录项的值占10位,所以指向页目录项(找到页表的地址)是CR3+线性地址表
的页目录值*4。
2.复制页表需要按照页目录来复制,具体项数则由size来指定。
3.页目录地址值必定是4B对齐。
4.size具体含义其实也是页目录个数。

再来看指向页目录地址的值,也就是页表地址的构成:


页目录格式

由于一个页目录能指向4MB对齐的物理地址,所以指向页表的地址中,其实有12位是用不上的,所以用其他的含义位代替了。

p--用于指明表项对地址转换是否有效。p=1,表示有效。p=0,表示无效。
r/w--读写标志。r/w=1,表示页面可被读、写或执行。r/w=0,表示页面只读或可执行。
u/s--用户/超级用户标志。u/s=1,表示运行在任何特权级上的程序都可以访问该页面。u/s=0,
页面只能被运行在超级用户特权级上的程序访问。

在复制页表时,目的页表对地址转换是不能有效的,有效则说明被其他程序或数据占用了。

经过上面的说明,具体到代码中,应该这个函数就很容易明白了。

有一个特殊情况是:
从进程0创建进程1,而进程0属于内核进程,在640KB以下,所以在该函数中有想应的判断语句。

3.4 复制进程信息 copy_process()

该函数是用来复制进程的关键信息,主要是设置结构体task_struct。并且复制页表信息。

该函数中有两个2个很重要的函数,分别为:copy_mem()copy_page_tables()

3.5 execve()

看这个函数则需要先理解代码与数据的布局:


代码与数据的空间布局

4.基本概念

4.1 进程组,会话

进程组与会话

通过这张图,同时说1个例子,则上面的概念就比较好理解了。

$ cat test.txt  |  grep for

上面这个例子展示的就是一个进程组。

5.实际场景与内核分析

作为内核的编写者,都是以实际应用场景出发并编码。作为分析者,则只能通过读内核之后,反着去分析作者为什么这么写,这样才会更好的理解内核,也不至于看着一堆代码头痛。

所以,下面的内容是从应用场景来分析内核代码。

5.1 打开文件

其实前面已经说过打开文件、找到文件的步骤,现在再通过代码的分析大致讲解一下:

sys_open()
    --->open_namei()
         --->dir_namei()
              --->get_dir()
                  --->find_entry()
                  --->iget()
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,088评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,715评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,361评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,099评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 60,987评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,063评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,486评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,175评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,440评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,518评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,305评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,190评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,550评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,880评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,152评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,451评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,637评论 2 335

推荐阅读更多精彩内容

  • 进程 创建 创建进程用fork()函数。fork()为子进程创建新的地址空间并且拷贝页表。子进程的虚拟地址空间...
    梅花怒阅读 1,855评论 0 7
  • 1.内存的页面置换算法 (1)最佳置换算法(OPT)(理想置换算法):从主存中移出永远不再需要的页面;如无这样的...
    杰伦哎呦哎呦阅读 3,198评论 1 9
  • 计算机系统漫游 代码从文本到可执行文件的过程(c语言示例):预处理阶段,处理 #inlcude , #defin...
    willdimagine阅读 3,540评论 0 5
  • 前言 北大《操作系统原理》[https://www.coursera.org/learn/os-pku]课堂笔记,...
    尤汐Yogy阅读 2,643评论 0 11
  • 1. 操作系统的资源管理技术 资源管理解决物理资源数量不足和合理分配资源这两个问题。 操作系统虚拟机为用户提供了一...
    joyeyoung阅读 10,731评论 1 5