以下是我折腾了两周很多才想明白的哦。项目地址:https://github.com/ying2025/VBS-encode-decode
一、编码事项:
1、js中整数和浮点数编码都采用浮点数64位编码,浮点数无法进行位操作,只能将其转为整数才能进行位操作。将小数转化为整数,在整数范围内计算结果,再把结果转化为小数,因为存在0-52位的一个范围,这个范围内的整数是可以被IEEE754浮点形式精确表示的,换句话说这个范围内的整数运算,结果都是精确的。这个可以参考:https://segmentfault.com/a/1190000009084877
2、js的整数位操作只能进行32位的位操作,多余32位的将会被舍弃。按照ES标准,两个需要运算的值会被先转为有符号的32位整型。所以超过32位的整数会被截断,而小数部分则会被直接舍弃。这个用乘除替代。这个可以参考:http://jerryzou.com/posts/do-you-really-want-use-bit-operators-in-JavaScript/
3、js的float64按照IEEE754标准存储,如下图所示。要对浮点数进行编码需要将符号位s,指数位e,和位数位m取出。然后对e和m进行编码即可。
而取出s,e,m对浮点数的表示很熟悉,不过已经有人帮我们把浮点数表示成了二进制,而我们只需要稍加改动一下就可以了。这个可以参考:https://cloud.tencent.com/developer/ask/72489。这里面最后返回的都是32位表示的。因为js只能进行32位的位操作运算。而我们不需要这里面最后返回的结果。
4、VBS编码参考家贵老师写的VBS编码: https://github.com/halftwo/knotty/blob/master/doc/vbs.rst
二、编码
1、获取float64的s,e,m,如下图所示。其中exponent获取是对flt取对数,然后向下取整,即直接获取flt的指数;mantissa是获取flt的小数部分。得到的s,e,m分别是符号位,指数位,小数位。
2、将m转为整数。接下来编码只对e,m两个进行编码,e本身就有符号,而m没有符号,因此把符号编码到m上。这里还有一些异常要处理,有待完善。
3、将_breakFloat、floatToNumber、assembleFloat封装对FloatOperate类中,并将其导出。将文件命名为float.js
4、重写JSON.stringify,对float进行编码。
曾经尝试使用JSON.stringify函数的第二个参数function对其传入参数直接编码然后返回到第二个位置,但是返回数组时发生了内存溢出,也试图将第二个参数直接赋值一个数组时,并没有得到预期的编码结果。后来查了查文档看到如下解释,后来果断决定重写stringify方法。
重头戏真正的到来了!
a、引入float.js文件
const floatOperate = require('./float.js');
b、获取e、m,并对e和m进行编码。对e采用整数的编码方式,对m采用浮点数的编码方式。下面先介绍浮点数的编码方式,整数编码方式将在c中讲解。其中kindConst.vbsKind.VBS_FLOATING = 0x1E
图 b-1
图 b-2
主要思想:当num转为二进制长度超过32位时,位操作时会造成精度损失,编码时也会有误差。因此将num转为二进制字符串,通过字符串截取方式来替代移位操作。这里主要的操作是将num的每一个字节取出,与0x80做‘|’运算,即除了最后一个字节外,将每个字节的最高位都置为1。
其实也可以直接取出某一位然后再进行操作,但这样比较麻烦,另外代码冗余量比较大。本人也试过,代码如下所示:
c、整数编码,其中对于指数e的编码参数传递时需要将isE设置为true。
kindConst.vbsKind.VBS_INTEGER = 0x40
图 c-1
图 c-2
图 c-3
_intShift函数主要是将num转为二进制字符串处理。通过字符串截取每次取num的一个字节与0x80做'|'操作,即将除了最后一个字节,其他字节的每个最高位都置为1,最后一个字节进行移位操作而没有进行截取操作,因为只少于等于32位的整数都可以进行位操作,最后一个字节肯定能进行位操作。对最后一个字符串截取操作的话,考虑情形多一些,因此这推荐进行位操作。
以上就是对float和int类型编码过程,对照家贵老师采用go语言所写的VBS编解码运行的结果是一致的。但对于特殊的:
+0.0 or -0.0 or 0.0还需要处理。另外判断一个number类型的数是否是整数使其对1取模运算是否为0或者是Number.isInteger的还需要改进。尝试过一个比较大的浮点数,例如:1222222222222222222.2,判断这个数是否为整数时结果为整数,可能是该数字转为二进制长度已超过52,造成精度损失。