http传输中base64编码数据
http为文本传输协议
Base64和ASCII的区别
ASCII码的范围是0-127,其中0-31和127这33个字符属于控制字符,剩下的32-126这95个字符属于可打印字符,包含了数字、大小写字母和常用符号等。他们与十进制的对应关系如下:
ascii编码表
这里面的某些字节在某些传输渠道中不支持, 比如邮件传输SMTP协议就不支持上面ASCII码中的控制字符, 只能传输可打印的ASCII字符。另外当byte值>127时,就超出了ASCII的表示范围,Base64的创建就是为了解决此问题。
base64是一种编码算法,Base64内的64是指64个字符【可打印字符】, 分别是 A-Z, a-z, 0-9, +, /它们与十进制的对应关系如下:
base64字符编码表
Base64采用6bit字符表达了原本的8bit字符,它可以将原本ACSII码的控制字符以及ASCII码之外的byte数字都转换成可打印的64位字符。
Base64编码原理
- 1)将所有字符转化为ASCII码;
- 2)将ASCII码转化为8位二进制;
- 3)将二进制3个归成一组(不足3个在后边补0)共24位,再拆分成4组,每组6位;
- 4)统一在6位二进制前补两个0凑足8位;
- 5)将补0后的二进制转为十进制;
- 6)从Base64编码表获取十进制对应的Base64编码;例如编码Man:
编码Man
字节数不为3的倍数时的处理过程
如果要编码的字节数不能被3整除,最后会多出1个或2个字节,那么可以使用下面的方法进行处理:先使用0字节值在末尾补足,使其能够被3整除,然后再进行base64的编码。在编码后的base64文本后加上一个或两个'='号,代表补足的字节数。也就是说,当最后剩余一个八位字节(一个byte)时,最后一个6位的base64字节块有四位是0值,最后附加上两个等号;如果最后剩余两个八位字节(2个byte)时,最后一个6位的base字节块有两位是0值,最后附加一个等号。 参考下表:
base64编码处理.png
'A'base64编码结果:'QQ =='
'BC'base64编码结果:QKM=
喜欢的关注我吧!