深入理解计算机系统 第二章 信息的表示和处理

[toc]

概 述

本章主要讲了整型和浮点型的各种用法。但我更想强调的是使用数据时可能会出现的误区

很多符合人常识的数学计算,在计算机中却可能得到不可思议的结果。
比如两个整数相加或者相乘,可能得到一个负数值,两个负数值相加,可能得到一个正值

所以我会在下一个灵魂拷问部分,把公开课上教授举出的各种puzzle都总结一下,如果你每个题都做对了,那么就说明掌握的非常好,不需要细看这篇博客了。

这本书主要基于 x86-64位,所以指针大小为8个字节,int类型为4个字节,float也是4个字节
这篇不是傻瓜型总结,要看的话需要一定的C语言基础。

配套课程实验 DataLab请看我的博客:深入理解计算机系统 CSAPP DataLab 2019.

参考资料:B站深入理解计算机系统公开课(有中文字幕,强烈推荐)


整型


整型 灵魂拷问

// initialization
int x = foo();
int y = bar();
unsigned ux = x;
unsigned uy = y;

x, y为int整型,ux,uy为无符号整型。x,y的值可能是,int类型取值范围内的任何一个数。
请问下列问题是否对所有符号要求的 x,y 都成立

  1. 已知 x < 0,可以得到 (x * 2) < 0

  2. 所有 ux 满足 ux >= 0

  3. 已知 `x & 7 == 7 ,可以得到(x << 30) < 0``

  4. 所有 ux 满足 ux >= -1

  5. 已知 x > y,可以得到 -x < -y

  6. 所有 x 满足 x * x >= 0

  7. 已知 x > 0 && y > 0,可以得到 x + y > 0

  8. 已知 x >= 0,可以得到 -x <= 0

  9. 已知 x <= 0,可以得到 -x >= 0

  10. 所有x 满足 (x | -x) >> 31 == -1


整型 灵魂拷问答案

  1. False, 反例:Tmin,也就是INT_MIN
  2. True, 无符号数一定大于0
  3. True, 向左偏移后,符号位为1,所以一定小于0
  4. False,有符号和无符号数在运算得时候,会自动讲有符号转换成无符号数。-1是最大的无符号数
  5. False, 反例:假设 x == 0, y == Tmin,x,y的相反数是x,y本身,所以后者不成立
  6. False
  7. False, Tmax + 1 == Tmin
  8. True
  9. False, 只有一个反例,那就是 x == Tmin
  10. False, 唯一反例,x == 0

整型学习要点

  • 64位和32位区别是什么?

64和32位,可以理解为指针的大小不同。32位系统,指针是4个字节,64位系统,指针是8个字节。
学过C都知道,指针上面保存的是地址,那么32位系统,指针的地址只有32位地方放,我们可以算一下最多存多少东西:

32位存放地址,有2 ^ 32种可能性,之后除以3个1024得到多少个G。最后得到4个G。也就是说32位系统的内存最多就是4G,多了就是浪费。64位就不一样了,当然我们现在的电脑,根本没法把2^64的内存填满。

  • 溢出

整型溢出的所有处理方法都是截断,而且C编译器不会给出任何的溢出警告。无论是乘法还是加法,只要超出了int的32位,都会只保留最低的32位,保留下来的符号位是1变成了负数,是0就变成非负数。

  • 补码

请点链接,我自己的写的另一篇博客:为什么计算机使用补码

  • Tmin Tmax

Tmin 是int的最小的数: 0x80000000
Tmax 是int的最大的数: 0x7FFFFFFF

对一个整数取相反数: ~x + 1,我也不知道为啥,就当数学定理背过就行了
所有整数有两个数的相反数是其本身: 0 和 Tmin,因为正数范围内没有一个数是和Tmin对应的。

他们之间还有一个关系 Tmax + 1 == Tmin

  • 移位

左移位比较简单,就移动就行了,右边多出来的用 0 填补

右移位看情况,不同的机器操作不一样。但是绝大多数情况下,右移位是算术移位,那就是左边多出来的位使用符号位填补

int是32位,如果你移动50位会怎么样?正常情况下系统会移动 (x mod 32) 位。也就是 50 % 32 == 18


浮点型

很多人(比如我)对浮点型的了解很有限,所以这里就讲具体做法吧,就不上题了


浮点型学习要点

前思后想不如直接提供一个讲的好的链接:IEEE浮点数
浮点数这个东西,其实在实际项目里面很难遇到,可能数据分析啥的用的比较多,但是正常的项目其实整型完全可以做,所以我这里就讲一下要点。

  • 组成

浮点数是由3部分组成的,符号位,指数位,尾数位
用float举例,符号位占1位,指数占8位,尾数占23位。
这8位指数,你要在中间割一刀,这一刀就是小数点,小数点左侧的数就像整型二进制一样,从小到大代表 1,2,4,8。但是小数点右边的数正好相反,代表,1/2,1/4,1/8,1/16。

  • 特性
  1. 如果你画一个数轴,然后把float能代表的点都画在上面,你会很明显的发现,越靠近0,点越密集,越远离0,点越稀疏
    这是因为尾数是一个固定的数,float从0到正无穷的过程中,指数会慢慢变大,一开始指数很小,所以点和点之间贴的特别近。但是之后指数爆炸增长,所以点和点离得特别远。

  2. 在上部分组成里面说的,指数部分是有小数点的,那么就容易理解,如果你这个数很大,那么精确性会变差,因为好多指数位都给了小数点左侧用,右侧少了自然不精确,反之亦然。

  • 结合律

浮点数不满足结合律。具体请看反例

(3.14 + 1e10) - 1e10 == 0

3.14 + (1e10 - 1e10) == 3.14

(1e20 * 1e20) * 1e-20 != 1e20
(1e20 * 1e20) * 1e-20 == infinite
1e20 * (1e20 * 1e-20) == 1e20


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。