大家好,我是阿萨。昨天和开发同学一起开会的时候。开发同学说到了用Base64编码,我立即说 不能使用Base64加密。然后开发来了一句Base64不是加密算法。当时懵了。默默记下这个知识点,回来学习下。
先给大家讲解下我为什么会有不能使用Base64加密的意识。很多年前,我遇到的第一个安全问题,就是敏感数据用Base64加密了。 事情起因是,我们接到一个bug,说有个敏感字段使用Base64在前端加密了,然后传给后端了。
基于之前的小故事,对于使用了Base64编码的地方就觉得不安全。这也是为什么会对开发说不能用Base64加密了,
今天我们就来学习下Base64编码。
一,Base64编码的由来。
传说,最开始互联网电子邮件都是英文的,后来互联网传到中国后,互联网电子邮件汉字就不认识了。所以就有了Base64编码,把中文变成可识别的英文。然后Base64编码被广泛用到各行各业。
以上只是传说。真实的由来,就不得而知了。
下面我们从计算机的底层传输过程中。它分为可见字符和不可见字符。可见字符比如我们熟知的ASCII码。
还有一些不可见的控制字符(0~31以及127),比如回车,换行等以及一些二进制数据都是不可见字符。
这些不可见字符在一些硬件,比如交换机,路由器以及网关等识别或者解析错误,导致错误发生,所以就有了Base64编码的市场。因此Base64产生了。
二,Base64 编码的原理
Base64编码就是要把不可见的字符转换成常见的64个字符的过程。
这64个字符是哪些呢?
那么它工作原理是啥呢?
1) 首先把整段传输内容全部划分成三个字节一组。这里就有了24bit了.
2) 然后把24bit 分成四组。每一组就有6bit
3)在6bit的最前面添加2个0,这样就有了8bit
4)把这8bit 转换成一个字节。查找上表中对应字符。所有其他分组内容按照这样的处理逻辑处理下。就得到了Base64的编码后字符。
注意,如果不够三字节,用0填到三字节,同时补充了多少个字节的0,末尾就添加就几个=。
分别图示下以上过程:
三个A
2个A,补充一个0
1个A,补充2个0
三,总结
Base64编码不是用来加密的,也不是加密算法。它只是用来编码的。切记不可用于加密。如果敏感信息用Base64编码加密了,赶紧提bug。
经过今天的学习,希望大家有所收获。
如果你喜欢今天的内容,欢迎点赞,关注。