首先需要明确,base64编码是一种可逆的编码方式,且其不算是加密方式,可是起到了一个看起来混淆原文的作用.
提到编码方式,我们会想到的肯定是Ascii、GBK、Unicode这些常用的编码方法,那么Base64与这些编码方式有什么不同呢?
简单来将,Base64就是一种用64个Ascii字符来表示任意二进制数据的方法。主要用于将不可打印的字符转换成可打印字符,或者简单的说将二进制数据编码成Ascii字符。Base64是网络上最常用的传输8bit字节数据的编码方式之一。
Base64的原理其实很简单,首先,需要准备一个包含64个字符的表格(如下表),0~63分别对应了唯一一个字符,比如18对应的是S。
所以,Base64编码会把3字节的二进制数据编码为4字节的文本数据,长度增加为原来的4/3。
其实,长度比在编码中是极为重要的一个元素,假如长度比越小(存在小于1的情况),则需要越大的编码字符集;假如长度比越大,则编码后的长度越大,意味着数据量变大,传输的时间变长。之所以Base64被广泛地用于数据传输的原因之一,就是它能在编码字符集的大小与编码后数据量的大小中取得比较好的平衡,即有一个恰到好处的长度比。
如果要编码的二进制数据不是3的倍数,最后会剩下1个或2个字节怎么办?此时,需在原数据后面添加1个或2个零值字节,使其字节数是3的倍数。然后,在编码后的字符串后面添加1个或2个等号“=”,表示所添加的零值字节数。解码的时候,会自动去掉。
所以,base64 实际上是用65个字符表示所有的二进制数据
下面来看一下Base64编码的优缺点。
优点:可以将二进制数据转换成可打印字符,方便传输数据;对数据进行简单的加密,肉眼安全。
缺点:内容编码后的体积会变大,编码和解码需要额外的工作量。
它的使用场景有很多,比如将图片等资源文件以Base64编码形式直接放于代码中,使用的时候反Base64后转换成Image对象使用;有些文本协议不支持不可见字符的传递,只能转换成可见字符来传递信息。有时在一些特殊的场合,大多数消息是纯文本的,偶尔需要用这条纯文本通道传一张图片之类的情况发生的时候,就会用到Base64,比如多功能Internet 邮件扩充服务(MIME)就是用Base64对邮件的附件进行编码的