程序设计语言概述

程序设计语言设计

阅读指引
读懂此文，需要以下基础:

至少写过5000行的代码;
汇编基础（静态数据段，代码段，堆栈段）。

有以下或者类似知识就更好了：

C语言编译，C++对象模型，MFC反射的实现
JAVA的解释器运行原理
使用过javascript，Python，PHP：感受过代码和类型系统在运行时的自由程度的不同
计算机组成原理

序 —— 一些问题

程序设计语言的目的是什么？
为什么大多数语言有控制流？逐行执行+跳转。这与我们的需求差很远（例如一个教务管理系统、一个自动打车APP）
为什么类型申明在C语言中要与控制流隔离开来?
现在主流语言最基本的元素是？
有没有语言它的类型结构，在运行时也可以改变？
动态性？

什么是动态性？

编译后确定了什么信息，之后不再改变；
运行时可以改变、添加什么；
运行时是否保存着类型信息。

程序中的信息分为几类？

数据信息
a) 编译时Meta-Data元数据（类型框架、空间占用）
b) 运行时Meta-Data元数据（继承体系、用于new或者反射）（特别区别编译与运行的Meta-Data的不同。）
c) 堆栈段中地址偏移（C++的switch case中不能声明变量、共享内存）
d) 静态段中地址
指令信息
a) 代码段（动态性需要操作系统或者虚拟机支持，例如动态链接库，动态类加载，lisp语言自生成代码）

语言举例

汇编语言

汇编语言没有动态性吗？
没有。首先，寄存器、数据段、堆栈、代码段完全由程序员控制。完完全全是写死了的。然后，根据冯诺伊曼机的规则；取指令，执行，取指令，执行……

既然都有数据段了，还要堆栈段来做什么？这不是多余？
一开始本没有堆栈，直到60年代出现了module模块化，才有了堆栈。汇编中的模块叫子程序，不过仍旧靠程序员全权控制。

堆栈和模块化的优点有？

递归
功能分离到模块，可复用
封装作用域

堆栈和模块化的缺点有？

时间上：保存现场、还原现场的代价（另，高级语言编译“消除尾递归”节约部分成本）
空间上：爆栈的危险

C语言

C语言比起汇编多了什么东西？

编译器
表达式（相比汇编，可以处理多个操作数了。）
函数与模块｛｝（真·模块化，栈操作无需程序员完成）
类型（原子类型、结构类型、数组、指针）
头文件，库
总之，C语言并没有比汇编多了新的特性，它只是把汇编的繁琐操作抽象出来，让编译器完成，减轻程序员负担。

编译器的作用是？
（减少程序员负担）

解析表达式，控制流（汇编中指令只有1-3个操作数，而表达式可以多个操作数）
模块和函数的抽象（完成堆栈中保存恢复现场的工作）
类型变量的管理（所有变量被替换成直接访问的地址，最快的访问速率）
代码优化

变量是替换成可以直接访问地址的？
a) 编译时的Meta-Data（struct的成员，数组的长度，以便替换到指令流；只在编译器中维护，编译结束后丢弃）
b) 计算出每个变量相对于该模块的偏移（一旦算出该偏移地址，将固定在执行码中，无法改变；就是说编译完成后，所有变量的偏移地址都固定下来了。）
c) 对变量的存储进行管理（所有的变量/内存地址的布置，都是在编译时确定的；也就是说，可执行码中没有类型信息，只有地址，任何数据都是地址来操作，完全和汇编类似。至于寄存器的安排，那是更下一层的类似缓存策略算法的结果。）

编译出来的执行码与汇编的执行码有特征的区别吗？
没有。特别是在编译器优化之后。
无法通过执行码，区分汇编和C程序。
打个比方，一只“程序猫”在黑笼子里，在里面喵喵的叫，无法通过它的叫声来判断它是“汇编猫”还是“C语言猫”。

从效率上来讲，C的多余代价在哪里？

编译的时间
模块的堆栈操作
总之，经过优化的C程序执行码与汇编效率几乎相同。
因为从理论上来说，C并没有引入运行时的新机制。
我理解的C语言只是一种汇编的宏而已。

C++语言
（推荐《深度探索C++对象模型》）

C++语言比C语言多了什么？

成员函数
类型继承体系
虚函数、虚继承
模板
涉及到了多种编程范式
（开始更抽象，语言逐渐开始脱离冯氏结构。）
其中，面向对象的思想，让程序与现实事物的关系更加紧密。
程序设计的负担，也因为OO与设计模式的流行，而变得轻松。

编程范式是什么？
就是一套指导思想行为准则。
（例如，C是过程式，Haskell是函数式，JAVA是面向对象，Python是简单的大杂烩，shell是调用命令的，lua是调用c程序的，PHP是写页面的，ProLog是线性逻辑推理的。
再例如，UML是描述规格specification的，XML是存储数据的。
再再例如，CSS是描述网页表现的，HTML是描述网页内容的。
javascript比较神奇，不敢说。）

C++有什么编程范式？

过程式（使用STL的类C语言编程）
ADT式（自定义抽象数据类型，继承；但是不用new，不用virtual；拷贝构造；为了防止资源泄漏，也发明了RAII的方式进行资源的初始化和释放）
面向对象式（使用new，使用virtual，需要指针或引用；实现多态。）
泛型编程（《Modern C++ Design》各种奇淫技巧，业务层代码比较少遇到）

C++编译器是怎样实现的？
C++开始有一个叫做cfront的编译器，即把C++语言先翻译成C语言。
然后再用C编译器来编译，C的编译器并不知道此段代码是来自C++还是C。

C++语言特性分别是怎样实现？简单说。

成员变量：和C语言的struct 类似，最后也会被直接替换成地址，便于高效访问。
成员函数：使用特殊函数名编码方案，翻译成C函数，并添加this指针作参数。（如___clsA12345func001(...,clsA *this)）
类型继承体系：通过C++编译时的Meta-Data来实现。即在编译时，编译器是知道类型信息与继承体系的，但是编译成C语言后就丧失了此类型信息。
虚函数、虚继承：为了支持多态，这也是“面向对象”最重要的特性，使用了虚函数表和虚基类表。注意，运行时多态是通过运行时查表实现的。稍后详细说。
模板：通过代码复制的方式实现。每次编译都需要重新编译，不能编成库文件直接使用。

C++编译器的准则与virtual机制？

首先，C++的编译准则，希望做到与C一样的效率。希望做到以下：
——a) 没有运行时调用间接性。任何数据在运行时都是一个地址直接就访问到。
——b) 没有运行时的Meta-Data。无需通过Meta-Data来访问某个复杂的类层次。
——c) 所有的数据都希望用C中struct来实现，即在编译时就确定好对象及其成员地址。
以上，在过程式范式，与ADT范式中都是成立的。
但是，在面向对象范式中，渴望做到：
需要维系着同一个继承体系成员结构的一致性，只有这样，才能保证运行时的多态性。即希望通过同一个入口，访问到父类或者子类的相同数据成员、函数成员，而不在乎具体对象的是父类还是子类。

C++的virtual机制如何实现的？
a) 虚函数
i. 虚函数，运行时，每个有虚函数的类型（哪怕是子类）都维持着一个虚函数表，这已经是运行时的Meta-Data，通过查表，即可找到对象自己的虚函数。
ii. 例如下图中clone肯定是object.__vptr__Base->#3()，无论具体的对象。
b) 多重继承
——如何处理后继的base基类？由编译器判断指针类型并加上相应的偏移。
c) 虚继承
——添加一个虚基类指针，指向共享部分。
这样的缺点有两个：

虚基类的子类都要背负一个基类指针指向共享部分。如果继承了多个虚基类，还需要多个这样的指针。（Microsoft的解决方法是增加一个虚基类表，类似于虚函数表。）
虚继承链条的增加，会导致间接访问的层次增加。例如两个菱形继承的串联。

跨平台的级别有哪些级别？——头文件，库，源代码

C++确实在源代码的层次是可能跨平台的（例如《POSA2》中加了针对不同平台的各种宏的代码）。
也可以通过相同的头文件去访问不同平台的库。
但是，不同操作系统中的不同的API大大增加了跨平台的难度。
跨平台的责任留给了程序员（充斥着大量宏的C++跨平台代码确实让人头疼。）
编译器面对不同的系统也不敢作为，它只是负责编译源代码，链接。

如何使用C++才能保证其高效性能？

有额外负担的机制：虚函数，虚继承，拷贝构造。
用一次虚函数，多了一次指针寻址的效率损失，并且相对于inline内联（另，inline是编译器优化的重头），还损失了保存和恢复现场的效率。
用一次虚继承，也多一次指针寻址的效率损失。（另，虚基类没有成员变量没有虚函数的时候会被优化。这也是JAVA可以多重继承接口interface的原因。）
不要使用virtual在复杂的多继承，深层次继承中。
编译速度会较慢：virtual机制会使编译器处理更多的Meta-Data。

JAVA语言
（推荐《本地Java代码的静态编译和动态编译问题》）

JAVA语言比C++语言多了什么？

虚拟机
a) 跨平台
b) 动态编译
c) 动态特性
没有指针
没有类的多继承，有接口的多继承。
统一的库
从编译来说，JAVA比C++迈出了一大步。
它的跨平台特性和运行时的灵活性，为JAVA自己以及未来语言都提供了很多可能性。

虚拟机的好处有什么？

跨平台：在OS与字节码间隔了一层。实现了程序员无负担的跨平台。
动态编译：许多信息不必在编译后确定，为动态特性提供可能，稍后详细说。
运行时维护着类型信息，甚至可以加载新的类型。（CORBRA依赖这个实现）

JAVA编译执行的过程是怎样的？

编译后产生一个基于堆栈的字节码。
JRE在不同的OS上提供支持。
起初的JRE是解释执行的，效率低下。
a) 获取待执行的下一个字节码。
b) 解码。
c) 从操作数堆栈获取所需的操作数。
d) 按照 JVM 规范执行操作。
e) 将结果写回堆栈。

JAVA是如何解决执行效率低下的问题呢？
使用JIT（Just-in-time）编译器进行动态编译。

JIT（Just-in-time）是怎样运行的呢？如何解决了效率的问题？
如上图：

每次按照一个function来编译。转成中间表示，并优化其效率，再生成可执行码。
编译器的编译线程和执行线程是分开的，应用程序不会等待编译的执行。
分析框架Profiler会观察程序行为，对频繁执行的function进一步优化。（例如function内部对象维持一个池不必每次生成。）

动态编译的优点有什么？
可以根据程序的行为，优化其代码

例如频繁执行的function——热方法
例如arrayCopy方法，如果每次都拷贝大段内存，在指令集中有特别指令可以加速。
例如类层次结构，多态的优化。（大多数虚调用都有其固定的一个目标，JIT因此生成的直接调用代码比虚表调用代码的效率会更高。）

动态编译的缺点有什么？

大量的初始编译会影响程序启动时间。
运行时候的编译，行为分析都需要花费时间。
运行效率达到稳定需要时间。
实时GUI型的程序不能忍受“动态编译”和“GC”带来的延迟。
JAVA如何解决实时的需求？

使用AOT（Ahead-of-time）编译器：预先编译成为可执行码。
AOT（Ahead-of-time）的缺点:
对于一些动态特性的支持效率低下

反射机制
运行时类加载
JIT与AOT的对比

总体来说，JAVA适合怎样的应用呢？
JAVA比较时候需要长期运行的应用，例如Web服务器，Daemon服务。

函数式语言

函数式语言通常有哪些呢？

函数式语言
a) Lisp
b) Scheme
c) Haskell（纯函数式）
d) F#？
包含了函数式特性的语言
a) Python
b) Javascript
c) JAVA
d) C?

函数式语言有哪些特性？

函数无副作用，只对输入输出有作用
高阶函数，lamda演算。(这个像C函数指针，但是它是高阶的，即返回值可能也是函数)
没有过程，类似规格说明的语法，更容易理解，自解释。
基于list的编程，函数更通用。
惰性计算（这个很像“树形DP”）
有对应的数学形式化表达，有可能证明其正确性。（最终目标可能是保证程序没有bug。）
其模型适合多核或者分布式的计算。
a) 不变性（immutable）
b) 惰性计算/按需计算（lazy evaluation）
c) 最重要的是，由于函数式语言不可在同一数据上做修改，每一次运用一个函数都会在新的位置产生新的数据，这与过程式语言在同一位置对数据做多次操作不同：函数式语言的函数依赖于前一次函数产生的结果数据，过程式语言依赖于数据的位置。这里函数式语言就暗含了计算的依赖顺序，如果没有前后顺序关系，就可以并发。而过程式语言没有指定这个顺序，就需要通过加锁、Actor、Channel等模式来指定这个顺序
总的来说，函数式语言，向着更抽象迈了一大步，更像是数学上的表达，几乎与冯诺伊曼体系断绝了关系。

函数式语言的劣势？

效率不高（因为其抽象，远离了冯诺伊曼体系）
平台以及开发环境都比较简单。
缺少推广，应用不广泛

逻辑程序设计
ProLog语言，线性逻辑。人工智能语言。没有接触过。

总结
动态性有哪些呢？

多态性：运行时根据具体对象来访问属于它的方法。（而不理会指针的类型。）
反射：运行时维系着类型结构的Meta-Data。
运行时类加载：运行后再次加载新的数据类型和指令流。
动态链接：OS根据按需链接库文件。

编译语言和解释语言的分界在哪里？
语言本身并没有编译类型或者解释类型。（例如：JAVA也可以静态编译后成可执行码。）只有少数运行时特性是依赖于解释型的。（可能需要运行环境的支持。）

为什么解释语言都需要虚拟机或者运行环境支持？
动态编译，运行时Meta-Data的保存，这些功能对于每个程序都是一致的。
所以把它们分离开来，不必每个程序植入这些代码

非脚本语言和脚本语言
脚本语言，我理解是负责调度其他代码的语言。
例如shell脚本（调用命令），lua（调用C）。

跨平台分为哪些层次？

源码跨平台（C，C++，但是因为系统调用接口不同，程序员负担太大，但是汇编却不是。）
执行码跨平台（JAVA，有些语言直接从源码解释执行，例如Javascript，PHP）

发展历史（推荐《近看图灵碗 (一. 从苏黎世到巴黎)》）

学术上有哪些实验性语言？

Fortran
ALGOL58
ALGOL60
Lisp
smalltalk

常用语言
过程式：C，ALGOL，Pascal，
面向对象式：C++，smalltalk，JAVA，Delphi
函数式：Lisp，Scheme，Haskell，
逻辑式：Prolog
脚本？PHP，Python，Ruby
存储描述信息：XML，CSS，HTML

回答问题
程序设计语言的目的是什么？

控制数据
控制指令流
为什么大多数语言有控制流？逐行执行+跳转。这与我们的需求差很远（例如一个教务管理系统。）
逐行执行，很大程度是起源于冯诺依曼体系结构。

为什么类型申明在C语言中要与控制流隔离开来?
因为在编译时，具体的类型信息，要转化成地址偏移，然后替换控制流中的类型变量。

现在主流语言最基本的元素是？
控制流与类型系统。

有没有语言它的类型结构，在运行时也可以改变？
Javascript只有对象没有类，使用prototype的方式继承，运行时给某个对象添加新的数据成员。没有类型体系。
许多后来的语言在运行时都保存着类型信息的，例如Python，JAVA。

综上所述
控制流——指令流
类型系统——为了计算出变量地址信息
区分运行时的Meta-Data与编译时的Meta-Data

最后编辑于：2017.11.27 04:48:46

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,126评论 6赞 481
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,254评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 152,445评论 0赞 341
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,185评论 1赞 278
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,178评论 5赞 371
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,970评论 1赞 284
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,276评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,927评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,400评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,883评论 2赞 323
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,997评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,646评论 4赞 322
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,213评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,204评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,423评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,423评论 2赞 352
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,722评论 2赞 345

程序设计语言概述

程序设计语言设计

推荐阅读更多精彩内容