从0开始自制解释器——实现简单的加法计算器

为什么要学习编译器和解释器呢?文中的作者给出的答案有下面几个:

  1. 为了深入理解计算机是如何工作的:一个显而易见的道理就是,如果你不懂编译器和解释器是如何工作的那么你就不明白计算机是如何工作的
  2. 编译器和解释器用到的一些原理和编程技巧以及算法在其他地方也可以用到。学习编译器和解释器能够学到并强化这些技巧的运用
  3. 为了方便日后能编写自己的编程语言或者专用领域的特殊语言

接下来我们就从0开始一步一步的构建自己的解释器。跟着教程先制作一个简单的加法计算器,为了保证简单,这个加法计算器能够解析的表达式需要满足下面几点:

  1. 目前只支持加法运算
  2. 目前只支持两个10以内的整数的计算
  3. 表达式之间不能有空格
  4. 只能计算一次加法

举一个例子来说,它可以计算诸如"1+2"、"5+6" 这样的表达式,但是不能计算像 "11+20"(必须是10以内)、"1.1+2"(需要两个数都是整数)、"1 + 2"(中间不能有空格)、"1+2+3"(只能计算一次加法)

有了这些限制,我们很容易就能实现出来。

实现的算法

假设我们要计算表达式 5+6。这里主要的步骤是通过字符串保存表达式,然后通过索引依次访问每个字符,分别找到两个整数和加法运算符,最后实现两个整数相加的操作。

第一步,我们的索引在表达式字符串的开始位置,解析得到当前位置的字符是一个整数,我们给它打上标记,类型为整形,值为5。


1.png

第二步,索引向前推进,解析当前位置的字符是一个+。还是给它打上标记,类型为plus,值为+

2.png

第三步,索引继续前进,解析到当前位置的字符是一个整数,我们给它打上标记,类型为整形,值为6


3.png

最后一步,根据得到的两个整数以及要执行的算术运算,我们将两个数直接进行相加得到最终结果

具体的代码

首先我们定义这个标记的类型,目前支持整数以及加法的标记

typedef enum e_TokenType
{
    CINT = 0, //整型
    PLUS //加法运算符
}ETokenType;

// 这里因为只支持10以内的整数,所以表示计算数字的字符只有一个,加上字符串最后的结束标记,字符数组只需要两个即可
typedef struct Token
{
    ETokenType type; //类型
    char value[2]; //值
}Token, *LPTOKEN;

接着定义一些全局变量来保存算术运算的表达式和当前指针的索引

char* g_pszUserBuf = NULL;
char* g_pPosition = NULL;

接着我们定义一个函数来模拟上述说到的不断解析每一个字符的过程

bool get_next_token(LPTOKEN pToken)
{
    char* sz = g_pPosition;
    g_pPosition++;
    pToken->value[0] = '\0';
    if (*sz >= '0' && *sz <= '9')
    {
        pToken->type = CINT;
        pToken->value[0] = *sz;
        return true;
    }
    else if (*sz == '+')
    {
        pToken->type = PLUS;
        pToken->value[0] = *sz;
        return true;
    }
    else
    {
        pToken->value[0] = '\0';
        return false;
    }
}

最后我们定义一个函数来执行获取每个标记并最终计算结果的操作

int expr()
{
    int val1 = 0, val2 = 0;
    Token token = { 0 };
    if (get_next_token(&token) && token.type == CINT)
    {
        val1 = atoi(token.value);
    }
    else
    {
        printf("首个字符必须是整数");
        return -1;
    }

    if (get_next_token(&token) && token.type == PLUS)
    {
    }
    else
    {
        printf("第二个字符必须是操作符,并且当前只支持 + 运算");
        return -1;
    }

    if (get_next_token(&token) && token.type == CINT)
    {
        val2 = atoi(token.value);
    }

    printf("%d+%d=%d\n", val1, val2, val1 + val2);
}

main函数里面我们只需要建立一个缓冲来保存字符,并且在循环中不断等待用户输入,完成解析并输出结果即可

// 重制当前解析环境
void reset()
{
    memset(g_pszUserBuf, 0x00, 16 * sizeof(char));
    scanf_s("%s", g_pszUserBuf);
    g_pPosition = g_pszUserBuf;
}

int main()
{
    g_pszUserBuf = (char*)malloc(16 * sizeof(char));
    while (1)
    {
        printf(">>>");
        reset();
        if (strcmp(g_pszUserBuf, "exit") == 0)
        {
            break;
        }
        expr();
    }
    return 0;
}

最终执行的结果如下


4.png

最后的总结

程序我们已经写完了,你可能觉得这个程序太简单了,只能做这点事情。别着急,后面将会逐步的去完善这个程序。以便它能实现更加复杂的运算。

最后我们来引入一些概念性的东西:

  1. 我们将输入内容按照一定规则打上的标记被称之为Token
  2. 上述get_next_token函数体现的将一段字符串分割并打上有意义的标签的过程被称为词法分析。
  3. 解释器工作的第一步就是将输入的字符串按照一定的规则转换为一系列有意义的标记。完成这个工作的组件被称之为词法分析器,也可以被称为扫描器或者分词器
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,271评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,275评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,151评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,550评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,553评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,559评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,924评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,580评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,826评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,578评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,661评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,363评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,940评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,926评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,156评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,872评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,391评论 2 342

推荐阅读更多精彩内容