记腾讯面试题-整形压缩

背景:

  • 对于一个整数,以uint32为例,其占用4字节,在存储的时候如果都使用4字节来存储uint32类型的数据,有些时候会存在浪费,因为并不是所有整形数据有效位都占用4个字节,例如像0x01用单个字节可以表达,而0x1ff则用2个字节就可以表达。而实际情况中,除了一些hash值等有可能占满4字节,大多数情况下我们的uint32数据是用不到4字节的。为解决这种情况,可以通过一个整形压缩的算法来解决内存/磁盘占用情况。

实现方式:

  • 使用低7位来表达有效值,高位来表达编码是否完成,如果高位为0代表编码完成,高位为1代表编码未完成,这样在解码的时候便可以通过遍历字节的高位来判断是否完成解码
  • 由于有效位只有7位,所以一个uint32的整形最少可以由1个字节完成编码,最多由5个字节完成编码,即 1~5个字节表示;类推uint64位的整形,则可以由 1 ~ 10个字节表示

编码实现:

void chartobs(char  ch, char* ps)
{
    const int  size = 8 * sizeof(char);
    for (int i = 7; i >= 0; i--, ch >>= 1)
    {
        ps[i] = (01 & ch) + '0';
    }
    ps[size] = '\0';
}

void itobs(int  n, char* ps)
{
    const int  size = 8 * sizeof(int);
    for (int i = size - 1; i >= 0; i--, n >>= 1)
    {
        ps[i] = (01 & n) + '0';
    }
    ps[size] = '\0';
}

void show_bstr(const char* str)
{
    size_t i = 0;
    while (str[i])
    {
        putchar(str[i]);
        if (++i % 8 == 0 && str[i])
            putchar(' ');
    }
    printf("\n");
}
//将一个四字节的整形数值压缩成1~5个字节
size_t encode(unsigned int num, char *buf)
{
    size_t len = 0;
for (int a = sizeof(unsigned int); a >= 0; a--)
    {
        char c;
        c = num >> (a * 7) & 0x7f;
        if (c == 0x00 && len == 0)
        {
            char szDest[16] = { 0 };
            chartobs(c, szDest);
            cout << szDest << " ";
            continue;
        }
        //处理高位标识
        if (a == 0)
            c &= 0x7f;
        else
            c |= 0x80;
        buf[len] = c;
        len++;

        char szDest[16] = { 0 };
        chartobs(c, szDest);
        cout << szDest << " ";
    }
    cout << endl;
    if (len == 0)
    {
        len++;
        buf[0] = 0;
    }
    return len;
}

//将一个1~5个字节的值还原成四字节的整形值
unsigned int decode(char *buf, size_t len)
{
    unsigned int num = 0;
    for (int index = 0; index < (int)len; index++)
    {
        char c = *(buf + index);
        num = num << 7;

        c &= 0x7f;
        num |= c;
    }
    cout << "decode: " << num << endl;
    return num;
}

测试用例:

int main(void)
{
    unsigned int num = 300;
    char szShowStr[64] = { 0 };
    itobs(num, szShowStr);
    show_bstr(szShowStr);

    char szDest[5] = { 0 };
    size_t len = encode(num, szDest);

    system("pause");
    return 0;
}

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,456评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,370评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,337评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,583评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,596评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,572评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,936评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,595评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,850评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,601评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,685评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,371评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,951评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,934评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,167评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,636评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,411评论 2 342