Base64 的原理、实现及应用

Base64编码是基于64个字符(字符分别为:ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxzy0123456789+/)的编码方式,因为2的6次方正好为64,所以我们用6bit就可以表示出64个字符,eg:000000对应'A',000001对应'B',111111对应'/'。
转换表如下:


QQ截图20160411092432.png

按我们的习惯,8bit是1个字节,所以我们正常使用的时候,一般都是1Byte=8bit(字符'a'=97=01100001)来使用。所以我们处理字符串的时候会遇到8bit/16bit/24bit/32bit……的情况,而Base64按照6bit为一个单元,处理的时候会遇到6bit/12bit/18bit/24bit/30bit……的情况,8和6的最小公倍数是24,所以我们用1、2、3个正常字符这三种情况就可以把所有需要转换成Base64的字符串概括了。

  • 被3整除个字符(3/6/9/12……):abc=01100001 01100010 01100011 分成Base64分组后为:011000 010110 001001 100011 即24 22 9 35,对应Base64编码的 YWJj
  • 除3余1个字符(2/5/8/11……):ab=01100001 01100010,分成Base64分组后为:011000 010110 0010,0010不够6bit,需要补0为:001000,得到YWI,因为4个Base编码为一组,最后再补上'='补齐一组,即:YWI=
  • 除3余2个字符(1/4/7/10……):a=011000010,分成Base64分组后为:011000 01,01不够6bit,需要补0为:010000,得到YQ,因为4个Base编码为一组,最后再补上'='补齐一组,即:YQ==

上面的文字归结为下图:

QQ截图20160411094646.png

可以看出,所有转换后的Base64编码都是4个字符的倍数(4/8/12/16……),如果不够4个字符的,都用'='填充了。

/**
 * <p>Base64编码是基于64个字符(字符分别为:ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxzy0123456789+/)的编码方式,
 * 因为2的6次方正好为64,所以我们用6bit就可以表示出64个字符,eg:000000对应A,000001对应B</p>
 * <p>按我们的习惯,一般都是1Byte=8bit(字符'a'=97=01100001)的使用,所以我们可以用24bit(6和8的最小公倍数)来进行分组,24正好事3BYTE,可以分出4组Base64的分组,需要编码的字符串有如下情况:
 * <li>被3整除:abc=01100001 01100010 01100011 分成Base64分组后为:011000 010110 001001 100011 即24 22 9 35,对应Base64编码的 YWJj</li>
 * <li>除3余1:ab=01100001 01100010,分成Base64分组后为:011000 010110 0010,0010不够6bit,需要补0为:001000,得到YWI,因为4个Base编码为一组,最后再补上'='补齐一组,即:YWI=</li>
 * <li>除3余2:a=011000010,分成Base64分组后为:011000 01,01不够6bit,需要补0为:010000,得到YQ,因为4个Base编码为一组,最后再补上'='补齐一组,即:YQ==</li>
 * </p>
 * @author chmod400
 *
 */
public class Base64Utils {
    
    private static String codeStr = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxzy0123456789+/";
    private static char[] code = codeStr.toCharArray();
    
    /**
     * 对字符串进行Base64编码
     * @param str
     * @return
     */
    public static String encode(String str) {
        if(str == null) {
            throw new NullPointerException();
        }
        StringBuffer result = new StringBuffer();
        // 字符串转为二进制
        String binStr = str2Bin(str);
        // 6bit 为一个单元,需要补0的位数
        int tail = binStr.length() % 6;
        if(tail != 0) {//最后剩2bit,需要补4位,剩4位需要补2bit
            tail = 6 - tail;
        }
        for(int i = 0; i < tail; i++) {
            binStr += "0";
        }
        for(int i = 0; i < binStr.length() / 6; i++) {
            int beginIndex = i * 6;
            String s = binStr.substring(beginIndex, beginIndex+6);
            // 二进制转十进制
            int codePoint = Integer.valueOf(s, 2);
            // 对应的字符
            char c = code[codePoint];
            result.append(c);
        }
        // 需要补=的位数
        int groupNum = binStr.length() / 6;// 6bit为一组
        if((groupNum % 4) != 0) {
            tail = 4 - groupNum % 4;
        }
        for(int i = 0; i < tail; i++) {
            result.append("=");
        }
        return result.toString();
    }

    /**
     * base64解码
     * @param str
     * @return
     */
    public static String decode(String str) {
        if(str == null) {
            throw new NullPointerException();
        }
        StringBuffer result =  new StringBuffer();
        // 去除末尾的'='
        int index = str.indexOf("=");
        if (index >= 0) {
            str = str.substring(0, index);
        }
        // base64字符串转换为二进制
        String binStr = base64Str2Bin(str);
        // 将二进制按8bit一组还原成原字符
        for(int i = 0; i < binStr.length() / 8; i++) {
            int beginIndex = i * 8;
            String s = binStr.substring(beginIndex, beginIndex+8);
            String c = bin2Str(s);
            result.append(c);
        }
        return result.toString();
    }
    
    /**
     * 字符串转换为二进制字符串
     * @param str
     * @return
     */
    private static String str2Bin(String str) {
        StringBuffer sb = new StringBuffer();
        // 字符串转为字符数组
        char[] c = str.toCharArray();
        for(int i = 0; i < c.length; i++) {
            // 将每个字符转换为二进制
            String s = Integer.toBinaryString(c[i]);
            // 需要补0的长度
            int len = 8 - s.length();
            for(int j = 0; j < len; j++) {
                s = "0" + s;
            }
            sb.append(s);
        }
        return sb.toString();
    }
    
    /**
     * Base64字符串转换为二进制字符串
     * @param str
     * @return
     */
    private static String base64Str2Bin(String str) {
        StringBuffer sb = new StringBuffer();
        // 字符串转为字符数组
        char[] c = str.toCharArray();
        for(int i = 0; i < c.length; i++) {
            // 将每个字符转换为二进制
            int index = codeStr.indexOf(c[i]);
            String s = Integer.toBinaryString(index);
            // 需要补0的长度
            int len = 6 - s.length();
            for(int j = 0; j < len; j++) {
                s = "0" + s;
            }
            sb.append(s);
        }
        return sb.toString();
    }
    
    /**
     * 二进制转换为字符串
     * @param binStr
     * @return
     */
    private static String bin2Str(String binStr) {
        StringBuffer sb = new StringBuffer();
        for(int i = 0; i < binStr.length() / 8; i++) {
            int beginIndex = i * 8;
            String s = binStr.substring(beginIndex, beginIndex+8);
            // 二进制转十进制
            int codePoint = Integer.valueOf(s, 2);
            // 对应的字符
            char c = Character.toChars(codePoint)[0];
            sb.append(c);
        }
        return sb.toString();
    }
    
    public static void main(String[] args) {
        System.out.println(str2Bin("ab"));
//      System.out.println(bin2Str("000001000001000001000000"));
        /*System.out.println(encode("a"));
        System.out.println(encode("ab"));
        System.out.println(encode("abc"));
        System.out.println(encode(""));
        System.out.println(encode(null));*/
        
//      System.out.println(encode(codeStr));
        
        System.out.println(decode("YQ=="));
        System.out.println(decode("YWI="));
        System.out.println(decode("YWJj"));
        System.out.println(decode("QUJDREVGR0hJSktMTU5PUFFSU1RVVldYWVphYmNkZWZnaGlqa2xtbm9wcXJydHV2d3h6eTAxMjM0NTY3ODkrLw=="));
        System.out.println(decode(""));
        System.out.println(decode(null));
    }

}

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,271评论 5 466
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,725评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,252评论 0 328
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,634评论 1 270
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,549评论 5 359
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 47,985评论 1 275
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,471评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,128评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,257评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,233评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,235评论 1 328
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,940评论 3 316
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,528评论 3 302
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,623评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,858评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,245评论 2 344
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,790评论 2 339

推荐阅读更多精彩内容

  • 1. 什么是Base64 Base64是一种基于64个可打印字符来表示二进制数据的表示方法 Base64是一种编码...
    理查德成阅读 2,900评论 0 2
  • 加密就是为了安全通信而诞生的。没有通信,加密也没有太大存在的意义。 虽说Base64算不上一种加密,只是一种具有固...
    王韩峰阅读 922评论 0 3
  • 0x01 目录 常见编码: ASCII编码 Base64/32/16编码 shellcode编码 Quoted-p...
    H0f_9阅读 12,577评论 2 17
  • 1、Base64编码原理 下图为Base64编码索引表: 字符选用了"A-Z、a-z、0-9、+、/" 64个可打...
    M_JCs阅读 1,741评论 1 9
  • ** Base64用于将二进制数据编码成ASCII字符 ** (图片、文件等都可转化为二进制数据)传输信道只支持A...
    峰峰小阅读 4,573评论 0 0