版权声明:本文为 gfson
原创文章,转载请注明出处。
注:作者水平有限,文中如有不恰当之处,请予以指正,万分感谢。
1. 相关数学术语
2. C 语言整形数据类型的取值范围
long 类型在 32 位和 64 位机器上的取值范围不同,一般 64 位机器用 8 个字节表示,32 位机器用 4 个字节表示。
C 语言标准定义了每种数据类型必须能够表示的最小取值范围。
3. 有符号数和无符号数
C 和 C++ 都支持有符号数(默认)和无符号数,Java 只支持有符号数。
4. 无符号数编码的定义
5. 补码编码的定义
- 最常见的有符号数的计算机表示方式就是补码。
- 在这个定义中,将字的最高有效位解释为负权。
6. 几个重要数字的位模式和数值
- 注意,-1 和 UMaxw 有同样的位表示——一个全 1 的串。
7. 确定大小的整数类型
- 在使用 PRId32 和 PRI64u 时,需要包含头文件
inttypes.h
。 - Java 中只支持有符号数,并且用补码表示,且 int 占 4 个字节,long 占 8 个字节。
8. 有符号数原码和反码的表示
- 对比补码、原码、反码三种表示方式的公式。
- 理解 Tow's complement 和 Ones' complement 术语命令的来源。
- 补码理解:2w - x 计算 -x 的 w 位表示(这里只有一个 2)。
例如:- x = 3,x 的四位补码表示 [0011]。
- 24 - x = 16 -3 = 13,13 的无符号数表示为 [1101]。
- -x = -3,-3 的四位补码表示为 [1101]。
- 反码理解:[111...1] - x 计算 -x 的反码表示(这里有很多个1)。
例如:- x = 3,x 的四位反码表示 [0011]。
- [1111] - x = [1111] - [0011] = [1100]。
- -x = -3,-3 的四位反码表示为 [1100]。
- 补码理解:2w - x 计算 -x 的 w 位表示(这里只有一个 2)。
9. 有符号数和无符号数之间的转化
- 补码转化为无符号数
- 无符号数转化为补码
- 两者转化示意图
- 在 C 语言中,允许无符号数和有符号数的转换,大多数系统遵循的原则是底层的位表示不变。
- 在一台采用补码的机器上,从无符号数转化为有符号数时,效果就是应用函数 U2Tw,而从有符号数转化为无符号数时,效果就是应用函数 T2Uw,其中 w 表示数据类型的位数。
- 当执行一个运算时,如果它的一个运算数是有符号的而另一个是无符号的,那么 C 语言会将有符号参数强制类型转化为无符号数,并假设这两个数都是非负的,来执行运算。
10. C 语言中 TMin 的写法
11. 扩展一个数字的位表示
- 无符号数的零扩展
- 补码数的符号扩展
- 从一个数据大小到另一个数据大小的转换,以及无符号数和有符号数之间的转化的相对顺序可以影响一个程序的行为。
short 转换为 unsigned int 时,先 short -> int,然后 int -> unsigned int,这是 C 语言标准要求的。
- 思考如下练习题:
答案如下:
12. 截断数字
- 截断无符号数
- 截断补码数值
13. 关于无符号数隐式强制类型转换导致的问题
-
问题 1:
-
问题 2:
-
答案
思考:
从以上两个问题中,我们可以发现无符号数运算的一个特性,既当两个数字相减时,若其中有一个是无符号数,则两个数字都转化为无符号数运算,若运算结果是一个负数,则这个负数转化为无符号数后会导致结果出现偏差。-
解决方法:
- 在运算上尽量避免使用无符号数,若碰到无符号数参与的运算,需要多加谨慎。
- 碰到无符号数参与的减法运算时,需要小心运算的结果是负数转化为无符号数后会导致的问题。
- 由于类型 size_t 是定义为 unsigned int 的,所以,在使用 size_t 时需要考虑到这一点。
函数 getpeername 的安全漏洞:
- 思考:
在使用 size_t 类型的参数时,应该保证这个参数的值的所有可能情况为 size_t 类型,不会出现其他类型导致的数据类型不匹配的情况。