程序设计语言概述

程序设计语言设计

阅读指引
读懂此文,需要以下基础:

  1. 至少写过5000行的代码;
  2. 汇编基础(静态数据段,代码段,堆栈段)。

有以下或者类似知识就更好了:

  1. C语言编译,C++对象模型,MFC反射的实现
  2. JAVA的解释器运行原理
  3. 使用过javascript,Python,PHP:感受过代码和类型系统在运行时的自由程度的不同
  4. 计算机组成原理

序 —— 一些问题

  1. 程序设计语言的目的是什么?
  2. 为什么大多数语言有控制流?逐行执行+跳转。这与我们的需求差很远(例如一个教务管理系统、一个自动打车APP)
  3. 为什么类型申明在C语言中要与控制流隔离开来?
  4. 现在主流语言最基本的元素是?
  5. 有没有语言它的类型结构,在运行时也可以改变?
    动态性?

什么是动态性?

  1. 编译后确定了什么信息,之后不再改变;
  2. 运行时可以改变、添加什么;
  3. 运行时是否保存着类型信息。

程序中的信息分为几类?

  1. 数据信息
    a) 编译时Meta-Data元数据(类型框架、空间占用)
    b) 运行时Meta-Data元数据(继承体系、用于new或者反射)(特别区别编译与运行的Meta-Data的不同。)
    c) 堆栈段中地址偏移(C++的switch case中不能声明变量、共享内存)
    d) 静态段中地址
  2. 指令信息
    a) 代码段(动态性需要操作系统或者虚拟机支持,例如动态链接库,动态类加载,lisp语言自生成代码)

语言举例

汇编语言

汇编语言没有动态性吗?
没有。首先,寄存器、数据段、堆栈、代码段完全由程序员控制。完完全全是写死了的。然后,根据冯诺伊曼机的规则;取指令,执行,取指令,执行……

既然都有数据段了,还要堆栈段来做什么?这不是多余?
一开始本没有堆栈,直到60年代出现了module模块化,才有了堆栈。汇编中的模块叫子程序,不过仍旧靠程序员全权控制。

堆栈和模块化的优点有?

  1. 递归
  2. 功能分离到模块,可复用
  3. 封装作用域

堆栈和模块化的缺点有?

  1. 时间上:保存现场、还原现场的代价(另,高级语言编译“消除尾递归”节约部分成本)
  2. 空间上:爆栈的危险

C语言

C语言比起汇编多了什么东西?

  1. 编译器
  2. 表达式(相比汇编,可以处理多个操作数了。)
  3. 函数与模块{}(真·模块化,栈操作无需程序员完成)
  4. 类型(原子类型、结构类型、数组、指针)
  5. 头文件,库
    总之,C语言并没有比汇编多了新的特性,它只是把汇编的繁琐操作抽象出来,让编译器完成,减轻程序员负担。

编译器的作用是?
(减少程序员负担)

  1. 解析表达式,控制流(汇编中指令只有1-3个操作数,而表达式可以多个操作数)
  2. 模块和函数的抽象(完成堆栈中保存恢复现场的工作)
  3. 类型变量的管理(所有变量被替换成直接访问的地址,最快的访问速率)
  4. 代码优化

变量是替换成可以直接访问地址的?
a) 编译时的Meta-Data(struct的成员,数组的长度,以便替换到指令流;只在编译器中维护,编译结束后丢弃)
b) 计算出每个变量相对于该模块的偏移(一旦算出该偏移地址,将固定在执行码中,无法改变;就是说编译完成后,所有变量的偏移地址都固定下来了。)
c) 对变量的存储进行管理(所有的变量/内存地址的布置,都是在编译时确定的;也就是说,可执行码中没有类型信息,只有地址,任何数据都是地址来操作,完全和汇编类似。至于寄存器的安排,那是更下一层的类似缓存策略算法的结果。)

编译出来的执行码与汇编的执行码有特征的区别吗?
没有。特别是在编译器优化之后。
无法通过执行码,区分汇编和C程序。
打个比方,一只“程序猫”在黑笼子里,在里面喵喵的叫,无法通过它的叫声来判断它是“汇编猫”还是“C语言猫”。

从效率上来讲,C的多余代价在哪里?

  1. 编译的时间
  2. 模块的堆栈操作
    总之,经过优化的C程序执行码与汇编效率几乎相同。
    因为从理论上来说,C并没有引入运行时的新机制。
    我理解的C语言只是一种汇编的宏而已。

C++语言
(推荐《深度探索C++对象模型》)

C++语言比C语言多了什么?

  1. 成员函数
  2. 类型继承体系
  3. 虚函数、虚继承
  4. 模板
  5. 涉及到了多种编程范式
    (开始更抽象,语言逐渐开始脱离冯氏结构。)
    其中,面向对象的思想,让程序与现实事物的关系更加紧密。
    程序设计的负担,也因为OO与设计模式的流行,而变得轻松。

编程范式是什么?
就是一套指导思想行为准则。
(例如,C是过程式,Haskell是函数式,JAVA是面向对象,Python是简单的大杂烩,shell是调用命令的,lua是调用c程序的,PHP是写页面的,ProLog是线性逻辑推理的。
再例如,UML是描述规格specification的,XML是存储数据的。
再再例如,CSS是描述网页表现的,HTML是描述网页内容的。
javascript比较神奇,不敢说。)

C++有什么编程范式?

  1. 过程式(使用STL的类C语言编程)
  2. ADT式(自定义抽象数据类型,继承;但是不用new,不用virtual;拷贝构造;为了防止资源泄漏,也发明了RAII的方式进行资源的初始化和释放)
  3. 面向对象式(使用new,使用virtual,需要指针或引用;实现多态。)
  4. 泛型编程(《Modern C++ Design》各种奇淫技巧,业务层代码比较少遇到)

C++编译器是怎样实现的?
C++开始有一个叫做cfront的编译器,即把C++语言先翻译成C语言。
然后再用C编译器来编译,C的编译器并不知道此段代码是来自C++还是C。

C++语言特性分别是怎样实现?简单说。

  1. 成员变量:和C语言的struct 类似,最后也会被直接替换成地址,便于高效访问。
  2. 成员函数:使用特殊函数名编码方案,翻译成C函数,并添加this指针作参数。(如___clsA12345func001(...,clsA *this))
  3. 类型继承体系:通过C++编译时的Meta-Data来实现。即在编译时,编译器是知道类型信息与继承体系的,但是编译成C语言后就丧失了此类型信息。
  4. 虚函数、虚继承:为了支持多态,这也是“面向对象”最重要的特性,使用了虚函数表和虚基类表。注意,运行时多态是通过运行时查表实现的。稍后详细说。
  5. 模板:通过代码复制的方式实现。每次编译都需要重新编译,不能编成库文件直接使用。

C++编译器的准则与virtual机制?

  1. 首先,C++的编译准则,希望做到与C一样的效率。希望做到以下:
    ——a) 没有运行时调用间接性。任何数据在运行时都是一个地址直接就访问到。
    ——b) 没有运行时的Meta-Data。无需通过Meta-Data来访问某个复杂的类层次。
    ——c) 所有的数据都希望用C中struct来实现,即在编译时就确定好对象及其成员地址。
  2. 以上,在过程式范式,与ADT范式中都是成立的。
  3. 但是,在面向对象范式中,渴望做到:
    需要维系着同一个继承体系成员结构的一致性,只有这样,才能保证运行时的多态性。即希望通过同一个入口,访问到父类或者子类的相同数据成员、函数成员,而不在乎具体对象的是父类还是子类。

C++的virtual机制如何实现的?
a) 虚函数
i. 虚函数,运行时,每个有虚函数的类型(哪怕是子类)都维持着一个虚函数表,这已经是运行时的Meta-Data,通过查表,即可找到对象自己的虚函数。
ii. 例如下图中clone肯定是object.__vptr__Base->#3(),无论具体的对象。
b) 多重继承
——如何处理后继的base基类?由编译器判断指针类型并加上相应的偏移。
c) 虚继承
——添加一个虚基类指针,指向共享部分。
这样的缺点有两个:

  1. 虚基类的子类都要背负一个基类指针指向共享部分。如果继承了多个虚基类,还需要多个这样的指针。(Microsoft的解决方法是增加一个虚基类表,类似于虚函数表。)
  2. 虚继承链条的增加,会导致间接访问的层次增加。例如两个菱形继承的串联。

跨平台的级别有哪些级别?——头文件,库,源代码

  1. C++确实在源代码的层次是可能跨平台的(例如《POSA2》中加了针对不同平台的各种宏的代码)。
  2. 也可以通过相同的头文件去访问不同平台的库。
  3. 但是,不同操作系统中的不同的API大大增加了跨平台的难度。
  4. 跨平台的责任留给了程序员(充斥着大量宏的C++跨平台代码确实让人头疼。)
  5. 编译器面对不同的系统也不敢作为,它只是负责编译源代码,链接。

如何使用C++才能保证其高效性能?

  1. 有额外负担的机制:虚函数,虚继承,拷贝构造。
  2. 用一次虚函数,多了一次指针寻址的效率损失,并且相对于inline内联(另,inline是编译器优化的重头),还损失了保存和恢复现场的效率。
  3. 用一次虚继承,也多一次指针寻址的效率损失。(另,虚基类没有成员变量没有虚函数的时候会被优化。这也是JAVA可以多重继承接口interface的原因。)
  4. 不要使用virtual在复杂的多继承,深层次继承中。
  5. 编译速度会较慢:virtual机制会使编译器处理更多的Meta-Data。

JAVA语言
(推荐《本地Java代码的静态编译和动态编译问题》)

JAVA语言比C++语言多了什么?

  1. 虚拟机
    a) 跨平台
    b) 动态编译
    c) 动态特性
  2. 没有指针
  3. 没有类的多继承,有接口的多继承。
  4. 统一的库
    从编译来说,JAVA比C++迈出了一大步。
    它的跨平台特性和运行时的灵活性,为JAVA自己以及未来语言都提供了很多可能性。

虚拟机的好处有什么?

  1. 跨平台:在OS与字节码间隔了一层。实现了程序员无负担的跨平台。
  2. 动态编译:许多信息不必在编译后确定,为动态特性提供可能,稍后详细说。
  3. 运行时维护着类型信息,甚至可以加载新的类型。(CORBRA依赖这个实现)

JAVA编译执行的过程是怎样的?

  1. 编译后产生一个基于堆栈的字节码。
  2. JRE在不同的OS上提供支持。
  3. 起初的JRE是解释执行的,效率低下。
    a) 获取待执行的下一个字节码。
    b) 解码。
    c) 从操作数堆栈获取所需的操作数。
    d) 按照 JVM 规范执行操作。
    e) 将结果写回堆栈。

JAVA是如何解决执行效率低下的问题呢?
使用JIT(Just-in-time)编译器进行动态编译。

JIT(Just-in-time)是怎样运行的呢?如何解决了效率的问题?
如上图:

  1. 每次按照一个function来编译。转成中间表示,并优化其效率,再生成可执行码。
  2. 编译器的编译线程和执行线程是分开的,应用程序不会等待编译的执行。
  3. 分析框架Profiler会观察程序行为,对频繁执行的function进一步优化。(例如function内部对象维持一个池不必每次生成。)

动态编译的优点有什么?
可以根据程序的行为,优化其代码

  1. 例如频繁执行的function——热方法
  2. 例如arrayCopy方法,如果每次都拷贝大段内存,在指令集中有特别指令可以加速。
  3. 例如类层次结构,多态的优化。(大多数虚调用都有其固定的一个目标,JIT因此生成的直接调用代码比虚表调用代码的效率会更高。)

动态编译的缺点有什么?

  1. 大量的初始编译会影响程序启动时间。
  2. 运行时候的编译,行为分析都需要花费时间。
  3. 运行效率达到稳定需要时间。
  4. 实时GUI型的程序不能忍受“动态编译”和“GC”带来的延迟。
    JAVA如何解决实时的需求?

使用AOT(Ahead-of-time)编译器:预先编译成为可执行码。
AOT(Ahead-of-time)的缺点:
对于一些动态特性的支持效率低下

  1. 反射机制
  2. 运行时类加载
    JIT与AOT的对比

总体来说,JAVA适合怎样的应用呢?
JAVA比较时候需要长期运行的应用,例如Web服务器,Daemon服务。

函数式语言

函数式语言通常有哪些呢?

  1. 函数式语言
    a) Lisp
    b) Scheme
    c) Haskell(纯函数式)
    d) F#?
  2. 包含了函数式特性的语言
    a) Python
    b) Javascript
    c) JAVA
    d) C?

函数式语言有哪些特性?

  1. 函数无副作用,只对输入输出有作用
  2. 高阶函数,lamda演算。(这个像C函数指针,但是它是高阶的,即返回值可能也是函数)
  3. 没有过程,类似规格说明的语法,更容易理解,自解释。
  4. 基于list的编程,函数更通用。
  5. 惰性计算(这个很像“树形DP”)
  6. 有对应的数学形式化表达,有可能证明其正确性。(最终目标可能是保证程序没有bug。)
  7. 其模型适合多核或者分布式的计算。
    a) 不变性(immutable)
    b) 惰性计算/按需计算(lazy evaluation)
    c) 最重要的是,由于函数式语言不可在同一数据上做修改,每一次运用一个函数都会在新的位置产生新的数据,这与过程式语言在同一位置对数据做多次操作不同:函数式语言的函数依赖于前一次函数产生的结果数据,过程式语言依赖于数据的位置。这里函数式语言就暗含了计算的依赖顺序,如果没有前后顺序关系,就可以并发。而过程式语言没有指定这个顺序,就需要通过加锁、Actor、Channel等模式来指定这个顺序
    总的来说,函数式语言,向着更抽象迈了一大步,更像是数学上的表达,几乎与冯诺伊曼体系断绝了关系。

函数式语言的劣势?

  1. 效率不高(因为其抽象,远离了冯诺伊曼体系)
  2. 平台以及开发环境都比较简单。
  3. 缺少推广,应用不广泛

逻辑程序设计
ProLog语言,线性逻辑。人工智能语言。没有接触过。

总结
动态性有哪些呢?

  1. 多态性:运行时根据具体对象来访问属于它的方法。(而不理会指针的类型。)
  2. 反射:运行时维系着类型结构的Meta-Data。
  3. 运行时类加载:运行后再次加载新的数据类型和指令流。
  4. 动态链接:OS根据按需链接库文件。

编译语言 和 解释语言 的分界在哪里?
语言本身并没有编译类型或者解释类型。(例如:JAVA也可以静态编译后成可执行码。)只有少数运行时特性是依赖于解释型的。(可能需要运行环境的支持。)

为什么解释语言都需要虚拟机或者运行环境支持?
动态编译,运行时Meta-Data的保存,这些功能对于每个程序都是一致的。
所以把它们分离开来,不必每个程序植入这些代码

非脚本语言 和 脚本语言
脚本语言,我理解是负责调度其他代码的语言。
例如shell脚本(调用命令),lua(调用C)。

跨平台分为哪些层次?

  1. 源码跨平台(C,C++,但是因为系统调用接口不同,程序员负担太大,但是汇编却不是。)
  2. 执行码跨平台(JAVA,有些语言直接从源码解释执行,例如Javascript,PHP)

发展历史(推荐《近看图灵碗 (一. 从苏黎世到巴黎)》)

学术上有哪些实验性语言?

  1. Fortran
  2. ALGOL58
  3. ALGOL60
  4. Lisp
  5. smalltalk

常用语言
过程式:C,ALGOL,Pascal,
面向对象式:C++,smalltalk,JAVA,Delphi
函数式:Lisp,Scheme,Haskell,
逻辑式:Prolog
脚本?PHP,Python,Ruby
存储描述信息:XML,CSS,HTML

回答问题
程序设计语言的目的是什么?

  1. 控制数据
  2. 控制指令流
    为什么大多数语言有控制流?逐行执行+跳转。这与我们的需求差很远(例如一个教务管理系统。)
    逐行执行,很大程度是起源于冯诺依曼体系结构。

为什么类型申明在C语言中要与控制流隔离开来?
因为在编译时,具体的类型信息,要转化成地址偏移,然后替换控制流中的类型变量。

现在主流语言最基本的元素是?
控制流 与 类型系统。

有没有语言它的类型结构,在运行时也可以改变?
Javascript只有对象没有类,使用prototype的方式继承,运行时给某个对象添加新的数据成员。没有类型体系。
许多后来的语言在运行时都保存着类型信息的,例如Python,JAVA。

综上所述
控制流——指令流
类型系统——为了计算出变量地址信息
区分运行时的Meta-Data与编译时的Meta-Data

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 195,980评论 5 462
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 82,422评论 2 373
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 143,130评论 0 325
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,553评论 1 267
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,408评论 5 358
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,326评论 1 273
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,720评论 3 386
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,373评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,678评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,722评论 2 312
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,486评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,335评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,738评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,009评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,283评论 1 251
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,692评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,893评论 2 335

推荐阅读更多精彩内容