JS 中关于 base64 的一些事

介绍
base64其实是一种编码转换方式, 将ASCII字符转换成普通文本, 是网络上最常见的用于传输8Bit字节代码的编码方式之一。
base64由字母a-z、A-Z、0-9以及+和/, 再加上作为垫字的=, 一共65字符组成一个基本字符集, 其他所有字符都可以根据一定规则, 转换成该字符集中的字符。

abcde => YWJjZGU=
ABCDE => QUJDREU=

在日常开发中, 最常见的便是将blob和base64之间相互转换.

// blob to base64
function blobTobase64(blob) {
    const fileReader = new FileReader()
    let base64 = ''
    fileReader.onload = () => {
        base64 = fileReader.result // 读取base64
    }
    fileReader.readAsDataURL(blob) // 读取blob
}
// base64 to blob
function dataURItoBlob(dataURI) {
  var mimeString = dataURI
    .split(',')[0]
    .split(':')[1]
    .split(';')[0] // mime类型
  var byteString = atob(dataURI.split(',')[1]) //base64 解码
  var arrayBuffer = new ArrayBuffer(byteString.length) //创建ArrayBuffer
  var intArray = new Uint8Array(arrayBuffer) //创建视图
  for (var i = 0; i < byteString.length; i++) {
    intArray[i] = byteString.charCodeAt(i)
  }
  return new Blob([intArray], { type: mimeString }) // 转成 blob
}

编码和解码

浏览器

最新的浏览器自带了两个方法用于base64的编码和解码

分别是atobbtoa

  • atob:将base64转成8bit字节码
  • btoa:将8bit字节码转成base64

对于旧版浏览器, 可以使用js-base64

Node

目前node中还不支持使用atobbtoa,但是可以通过Buffer来实现, 参考文档

if (typeof btoa === 'undefined') {
  global.btoa = function (str) {
    return Buffer.from(str).toString('base64');
  };
}

if (typeof atob === 'undefined') {
  global.atob = function (b64Encoded) {
    return Buffer.frome(b64Encoded, 'base64').toString();
  };
}
复制代码

转换方式

base64编码方式对于中文是不适用的, 因为中文对应多个字节, 因此可以先使用encodeURIComponent编码后再进行base64编码.

编码

每三个字节作为一组,每个字节8bit, 一共是24个二进制位。
'ABCD'
["ABC", "D"] // 每三字节做一组
['01000001010000100100001', '01000100'] // 转成8bit
复制代码

将每组的24个二进制位再细分为四组,每组有6个二进制位, 此时为二维数组。
[['010000', '010100', '001001', '000011'], ['010001', '00']]
复制代码
二个字节的情况:将这二个字节的一共16个二进制位, 按照上面的规则, 转成三组, 那么最后一项只有4位,则在后面加两个0, 补够6位, 并在第三步对应位置加上垫字符=。
一个字节的情况:将这一个字节的8个二进制位,按照上面的规则转成二组, 那么最后一项只有2位, 则在后面加上四个0, 并在第三步对应位置加上两个垫字符=。
简单说就是, 缺多少位就在后面补多少个0, 直到满6位。[['010000', '010100', '001001', '000011'], ['010001', '000000']]
复制代码

在每组前面加两个00,扩展成32个二进制位,即四个字节。

规则是这么说, 但这一步我觉得可以忽略, 因为00101010和101010 是一样的

将每组对应的二进制转成十进制, 在base64char字符集中找到对应的字符。
[["Q", "U", "J", "D"], ["R", "A"]]
复制代码

每一组都最终都应该转成四个字符

如果不足四个字符, 说明明文中并不足3字节, 因此需要补上垫字符=, 补够四个字符

[["Q", "U", "J", "D"], ["R", "A", "=", "="]]
复制代码

将最后的结果连接成字符串, 则为最终编码结果。

'ABCD' > 'QUJDRA=='

根据编码方式来看, 每3个字节将会被编码成四个字符, 如果不足3个字节, 则补上垫字符=, 缺几个就补几个。

btoa('A') // "QQ=="
btoa('AB') // "QUI="
btoa('ABC') // "QUJD"
btoa('ABCD') // "QUJDRA=="

解码
解码步骤就是跟编码步骤反过来

每四个字节分为一组。
将每组的中除了垫字符=外的字符, 在base64char字符集中找到所在下标。
将十进制下标转成二进制, 如果不够6位(一定不会超过6位), 则在前面补0。

如果遇到垫字符=, 说明其明文不足3字节, 则根据垫字符=的数量, 在该组最后一项中去掉对应个数的0
一个垫字符, 则去掉两个0
两个垫字符, 则去掉四个0

将每组中的二进制字符串连接,此时字符串长度一定是8的倍数,然后每8位分割成一个字节。
通过String.fromCharCode将二进制转成字符, 然后拼接
将各个字符连接, 为最终解码结果。

题外-进制转换

parseInt(str, radix): 根据radix可以将字符串转成十进制
initValue.toString(radix): 将initValue转成其他进制

// n进制转十进制
parseInt('1000', 2) // 8
parseInt('1000', 16) // 4096

// 进制间转换
(10).toString(2) // "1010", 10进制转2进制
(0xff).toString(2) // "11111111", 16进制转2进制

作者:zWing
链接:https://juejin.im/post/5ccf01d5e51d453a363848d6
来源:掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,122评论 6 505
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,070评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,491评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,636评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,676评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,541评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,292评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,211评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,655评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,846评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,965评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,684评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,295评论 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,894评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,012评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,126评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,914评论 2 355

推荐阅读更多精彩内容

  • 每个文本编辑器都有默认的编码方式(比如 UTF-8 编码),当我们保存文档的时候,可以选择编码方式,如果没有特意选...
    _于曼丽_阅读 1,521评论 0 1
  • 字符是用户可以读写的最小单位。计算机所能支持的字符组成的集合,就叫做字符集。字符集通常以二维表的形式存在。二维表的...
    刘惜有阅读 8,116评论 2 14
  • Base64编码由来 Base64最早是用来解决电子邮件的传输问题。 传统的电子邮件是1982年定下技术规范的,详...
    Ashton阅读 2,579评论 0 6
  • 今天是2018年10月12日,是《坚持星球声音训练营》第1期1营打卡第3天。 今天的练习很有趣,我和我家上一年级的...
    聖彬阅读 106评论 0 0
  • 和光芒四射的人比起来,大部分人都是没有存在感的。其实这并没什么关系,如果说你已经被人忽略了二十五年,感到很沮丧,那...
    五斗解酲阅读 483评论 0 1