在了解了计算机中的存储器之后,紧接着我们会有一些问题:CPU是怎样去访问内存地址空间的某一个地址的呢?接下来会以8086cpu架构作为例子来进行介绍(8086是老古董了,现代的CPU有i5架构的,还有i7架构的),之所以选择8086是因为它结构比较简单,适合上手,通过它学习到的概念,同样可以对其他CPU进行举一反三。
CPU要读写存储器,总得需要有导线把它们连在一起吧?在计算机中,这种导线称为总线,如果你拆过机箱就很清楚,它就是一根根的导线的集合,这些导线同时发送信号,每根导线要么高电平,要么低电平。总线按照功能的不同又分为地址总线,数据总线和控制总线。以上图为例,CPU要读取内存地址空间中地址为3的信息,大概分成以下步骤:
1.CPU向地址线输出物理地址3
2.控制线需要选择相应的存储设备,然后通知该设备,将要从中读取数据
3.该存储设备会将数据8送入数据线
CPU写信息到存储器的过程类似。
我们把上面的图放大,还可以再深入一点。
我们刚才说CPU和存储设备之间有总线相连,其实CPU内部也是有总线的,它连接着CPU中不同的部件,比如寄存器,运算器,控制器。但是计算机中,不同总线的位数不一定是一样的,比如8086CPU内部总线就是16位的,地址总线是20位的,数据总线是16位的。
那么问题来了?既然8086CPU是16位结构的,怎样才能做到输出20位的物理地址呢?其实很简单,地址加法器是这样解决的:段地址(16位)x 16 + 偏移地址(16位)= 物理地址(20位),比如B800H x 16 + 1111H=B9000H。如果对16进制不太熟悉,那我们可以用熟悉的10进制来描述这个计算,比如家,学校,图书馆在一条直线上,他们之间的距离如图所示,我们可以这样跟朋友描述图书馆的距离:图书馆离家200m,这其实就是它的物理地址了。但现在有一些限制,我们和朋友之间只能通过纸条来通信,不巧的是,纸条上只能写2位数,且纸条数量不限,于是我们约定规则:纸条1x10+纸条2=物理地址,比如在纸条1上写11,纸条2上写90,意思是说学校离家110m,图书馆离学校90m,这就ok了。而这2张纸条能表示的最远距离为99x10+99=1089。
现在看来,这里出现的段地址:偏移地址的概念,完全是因为8086CPU的硬件设计是这样的。我们设想一下,如果8086CPU的内部总线是20位的,不就可以直接表示物理地址了吗?!所以段地址:偏移地址的概念并不是关键,也许以后CPU硬件设计变了,采用完全不同的计算方式都说不定。
我们现在知道CPU是如何从内存读取信息的了,但是CPU怎么知道读过来的信息到底是普通的数据还是需要被执行的程序呢?很简单,我们知道CPU中有很多的寄存器(就是用来存放信息的),它指定了2个寄存器(分别叫CS, IP,CS用来存段地址,IP用来存偏移地址),让它们来表示当前需要被执行的机器码的物理地址,在执行代码的过程中,CPU会去维护CS和IP的值,比如每执行一句机器码,IP会增加相应的数值以指向下一句指令。以此类推,我们可以用其他的寄存器去表示数据的物理地址。所以说,内存中的二进制信息本来对CPU没有区别,全靠约定好的寄存器里面存放的地址,才得以区分程序和数据。