6.828 操作系统 Homework: Shell

题目介绍

https://pdos.csail.mit.edu/6.828/2016/homework/xv6-shell.html
通过此次作业，将会了解到 Shell 的工作原理，以及类 Linux 系统的新进程到底是如何产生的。
首先自然是看懂 main 函数。

int
main(void)
{
  static char buf[100];
  int fd, r;

  // Read and run input commands.
  while(getcmd(buf, sizeof(buf)) >= 0){
    if(buf[0] == 'c' && buf[1] == 'd' && buf[2] == ' '){
      // 如果只是 cd 命令，则切换文件夹后继续等待命令
      // Clumsy but will have to do for now.
      // Chdir has no effect on the parent if run in the child.
      // 一般写完命令敲回车，这里就是把回车改为'\0'
      buf[strlen(buf)-1] = 0;  // chop \n
      if(chdir(buf+3) < 0)
        fprintf(stderr, "cannot cd %s\n", buf+3);
      continue;
    }
    // 若不是 cd 命令，则fork出子程序尝试运行命令
    if(fork1() == 0)
      runcmd(parsecmd(buf));
    // 等待子进程完成
    wait(&r);
  }
  exit(0);
}

循环调用 getcmd 函数读入命令：

int
getcmd(char *buf, int nbuf)
{

  if (isatty(fileno(stdin)))  // 判断标准输入是否为终端
    fprintf(stdout, "6.828$ ");  // 是终端则显示提示符
  memset(buf, 0, nbuf);
  fgets(buf, nbuf, stdin);  // 从标准输入读入nbuf个字符到 buf 中
  if(buf[0] == 0) // EOF
    return -1;
  return 0;
}

读入命令并确定不是 cd 命令后，执行关键语句
runcmd(parsecmd(buf))，显然是将 buf 用 parsecmd 解析后，送入 runcmd 运行。我们暂时并不关心如何解析，无非是一些字符串处理，提取关键符号确定类型。先看 runcmd 函数。

// Execute cmd.  Never returns.
void
runcmd(struct cmd *cmd)
{
  int p[2], r;
  struct execcmd *ecmd;
  struct pipecmd *pcmd;
  struct redircmd *rcmd;

  if(cmd == 0)
    exit(0);
  
  switch(cmd->type){
  default:
    fprintf(stderr, "unknown runcmd\n");
    exit(-1);

  case ' ':
    ecmd = (struct execcmd*)cmd;
    if(ecmd->argv[0] == 0)
      exit(0);
    fprintf(stderr, "exec not implemented\n");
    // Your code here ...
    break;

  case '>':
  case '<':
    rcmd = (struct redircmd*)cmd;
    fprintf(stderr, "redir not implemented\n");
    // Your code here ...
    runcmd(rcmd->cmd);
    break;

  case '|':
    pcmd = (struct pipecmd*)cmd;
    fprintf(stderr, "pipe not implemented\n");
    // Your code here ...
    break;
  }    
  exit(0);
}

由此可看出，parsecmd 把命令分成了3个类型，分别是可执行命令，重定向命令，以及管道命令。

实现

可执行命令

在文中找到关键提示：

You may want to change the 6.828 shell to always try /bin, if the program doesn't exist in the current working directory, so that below you don't have to type "/bin" for each program. If you are ambitious you can implement support for a PATH variable.

也就是说对于 ls 这个存在的命令，我们只需要想办法将命令引导到 /bin/目录下寻找即可。这里涉及到 linux 系统调用的一个关键函数

int access(const char * pathname, int mode)

它的作用是检查能否对某个文件(pathname)执行某个操作(mode)，操作的主要模式有：

R_OK      // 测试读许可权
W_OK      // 测试写许可权
X_OK      // 测试执行许可权
F_OK      // 测试文件是否存在

需要注意的是，测试成功返回值为0。失败为-1。有了这个函数，可以把之前的类型为' '的部分改为：

  case ' ':
    ecmd = (struct execcmd*)cmd;
    if (ecmd->argv[0] == 0)
      exit(0);
    // fprintf(stderr, "exec not implemented\n");
    if (access(ecmd->argv[0], F_OK) == 0) {
    execv(ecmd->argv[0], ecmd->argv);
    } else {
    const char *binPath = "/bin/";
    int pathLen = strlen(binPath) + strlen(ecmd->argv[0]);
    char *abs_path = (char *)malloc((pathLen+1)*sizeof(char));
    strcpy(abs_path, binPath);
    strcat(abs_path, ecmd->argv[0]);
    if (access(abs_path, F_OK) == 0) {
        execv(abs_path, ecmd->argv);
    } else {
        fprintf(stderr, "%s: Command not found\n", ecmd->argv[0]);
    }
    }
    break;

需要补充说明的可能就是 execv 函数，它是 exec 函数族的一个，exec 函数族的作用就是根据 pathname 找到可执行文件，并用它取代调用进程的内容。虽然 pid 未改变，但是实际运行的内容已经不同。结合之前 main 函数中的内容，可以看出 Shell 执行某个命令实际上就是 fork 出一个子进程，然后把子进程替换为想要执行的程序。
测试结果为：

yy@yy-virtual-machine:~/OS/myShell$ ./myShell 
6.828$ ls
myShell  sh.c  t.sh
6.828$ ls ../
lab  multi-thread  myLogs  MyMemo.txt  myShell  qemu  qemu_mit_2.3  xv6-public
6.828$ abc
abc: Command not found
6.828$

可以看出，满足了要求的所有功能。

输入输出重定向

首先可能需要看一下配套的 xv6 教材第 10 页的文件系统，至少需要了解文件描述符 (file descriptor) 是什么。
刚开始写的时候还以为需要自己处理 '<' 和 '>' 情况，后来发现结构体 rcmd 中已经设置好，不需要分开处理。注意一下这个函数：

struct cmd*
redircmd(struct cmd *subcmd, char *file, int type)
{
  struct redircmd *cmd;

  cmd = malloc(sizeof(*cmd));
  memset(cmd, 0, sizeof(*cmd));
  cmd->type = type;
  cmd->cmd = subcmd;
  cmd->file = file;
  cmd->mode = (type == '<') ?  O_RDONLY : O_WRONLY|O_CREAT|O_TRUNC;
  cmd->fd = (type == '<') ? 0 : 1;
  return (struct cmd*)cmd;
}

看懂之后的工作就很简单了，结果代码为：

  case '>':
  case '<':
    rcmd = (struct redircmd*)cmd;
    // fprintf(stderr, "redir not implemented\n");
    // Your code here ...
    close(rcmd->fd);
    if (open(rcmd->file, rcmd->mode, 0644) < 0) {
    fprintf(stderr, "Unable to open file: %s\n", rcmd->file);
    exit(0);
    }
    runcmd(rcmd->cmd);
    break;

思路就是先关闭程序原先的标准输入/输出，打开指定文件作为新的标准输入/输出。
非常容易漏掉权限位，即open的第三个参数。注意这里用的是8进制数，所以一定不能直接写644而要写0644。
我还遇到了一个问题，在此记录一下，第一次权限设置不对，导致无法打开生成的文件，更改后运行，还是不行。后来发现其实由于只是 Truncate，没有把之前生成的文件删除新建，所以权限还是第一次有问题的版本。删掉之前的文件，重新运行，结果正常。

管道

本次作业的最难的就是管道。重点还是参考 xv6 教材 13 页管道部分，在 xv6 源码的 Sheet 86 还能找到管道的实现。重点是搞明白 pipe，dup 两个函数。

int pipe(int p[])
作用是建立一个缓冲区，并把缓冲区通过 fd 形式给程序调用。它将 p[0] 修改为缓冲区的读取端， p[1] 修改为缓冲区的写入端。
int dup(int old_fd)
作用是产生一个fd，指向 old_fd 指向的文件，并返回这个fd。产生的 fd 总是空闲的最小 fd。

  case '|':
    pcmd = (struct pipecmd*)cmd;
    // fprintf(stderr, "pipe not implemented\n");
    // Your code here ...
    if (pipe(p) < 0) fprintf(stderr,"pipe failed\n");
    if (fork1() == 0) {
    // 先关闭标准输出再 dup
    // dup 会把标准输出定向到 p[1] 所指文件，即管道写入端
    close(1);
    dup(p[1]);
    // 去掉管道对端口的引用
    close(p[0]);
    close(p[1]);
    // 此时 left 的标准输入不变，标准输出流入管道
    runcmd(pcmd->left);
    }
    if (fork1() == 0) {
    // 先关闭标准输入再 dup
    // dup 会把标准输入定向到 p[0] 所指文件，即管道读取端
    close(0);
    dup(p[0]);
    // 去掉管道对端口的引用
    close(p[0]);
    close(p[1]);
    // 此时 right 的标准输入从管道读取，标准输出不变
    runcmd(pcmd->right);
    }
    close(p[0]);
    close(p[1]);
    wait(&r);
    wait(&r);
    break;

比较费解的就是 fork 了两次，也 wait 了两次。我自己写了一个实现，似乎也能正常运行，并且只 fork 了一次。

  case '|':
    pcmd = (struct pipecmd*)cmd;
    // fprintf(stderr, "pipe not implemented\n");
    // Your code here ...
    if (pipe(p) < 0) fprintf(stderr,"pipe failed\n");
    if (fork1() == 0) {
    close(1);
    dup(p[1]);
    close(p[0]);
    close(p[1]);
    runcmd(pcmd->left);
    } else {
    close(0);
    dup(p[0]);
    close(p[0]);
    close(p[1]);
    runcmd(pcmd->right);
    }
    break;

最后，执行脚本判断：

yy@yy-virtual-machine:~/OS/myShell$ ./myShell < t.sh
sort: Command not found
wc: Command not found
uniq: Command not found

好的，又出现了问题。这几个命令都位于 /usr/bin/下，而我们在执行中只加入了 /bin/ 目录，于是我又为case ' '添加了一个一劳永逸的实现，方便以后添加新的路径。

  case ' ':
    ecmd = (struct execcmd*)cmd;
    if(ecmd->argv[0] == 0)
      exit(0);
    // fprintf(stderr, "exec not implemented\n");
    if(access(ecmd->argv[0], F_OK) == 0) {
    execv(ecmd->argv[0], ecmd->argv);
    } else {
    // 将路径改为数组实现
    const char *binPath[] = {"/bin/", "/usr/bin/"};
    char *abs_path;
    int bin_count = sizeof(binPath)/sizeof(binPath[0]);
    int found = 0;
    for (int i=0; i<bin_count && found==0; i++) {
        int pathLen = strlen(binPath[i]) + strlen(ecmd->argv[0]);
        abs_path = (char *)malloc((pathLen+1)*sizeof(char));
        strcpy(abs_path, binPath[i]);
        strcat(abs_path, ecmd->argv[0]);
        if(access(abs_path, F_OK) == 0) {
            execv(abs_path, ecmd->argv);
        found = 1;
        }
        free(abs_path);
    }
    if (found == 0) {
        fprintf(stderr, "%s: Command not found\n", ecmd->argv[0]);
    }
    }
    
    break;

运行成功，结果如下：

yy@yy-virtual-machine:~/OS/myShell$ ./myShell <t.sh 
      4       4      20
      4       4      20

最后编辑于：2017.12.06 13:16:01

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,362评论 5赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,330评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,247评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,560评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,580评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,569评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,929评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,587评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,840评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,596评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,678评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,366评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,945评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,929评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,165评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 43,271评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,403评论 2赞 342

6.828 操作系统 Homework: Shell

题目介绍

实现

可执行命令

输入输出重定向

管道

推荐阅读更多精彩内容