吴军老师在《信息论》课程中讲到了哈夫曼编码以及其在生活中的应用,听了之后有所感悟,于是写下这篇文章。
在编码体系中,一种方式是使用等长编码,就是用同样长度的字符来表示信息,而哈夫曼编码采用了不等长的编码,它将越常出现的信息采用较短的编码,不常出现信息采用较长的编码。
由于现实生活中,不同词出现的频率相差甚远,所以这种策略就能比采用同样码长的信息总体上更合算。
哈夫曼编码从本质上讲,是将最宝贵的资源(最短的编码)给出现概率最大的信息。
吴军老师还在文章中讲述了哈夫曼编码原理在风险投资、大公司产品选择、自身成长三方面的应用。
例一
若有一亿美元进行风险投资,可以分成四等分,每份2500万美元。先以25万美元/家投次100家公司,一段时间后以75万美元/家投其中表现较好的33家,第三轮再以250万/家投资较好的10家,第四轮以800万/家投资最好的3家。
这种方式通常不会错失上市公司,而且由于大部分资金集中到了上市或被收购的公司上,占股份的比例较高,所以投资回报会比100万美元/家投资最初100家公司要高。
例二
大公司内部各个项目一开始都有获得资源的可能性,但是三个月到半年,类似的项目就开始整合,资源开始集中到更有希望的项目上去。最后能够变成产品上市的是少数项目,但是大量的资源投入在其中了。这样既不会失去新的机会,也不会浪费资源。
例三
自身成长也一样,不要排斥尝试新东西,这样不会失去机会,对于花了一些精力,看样子做不成的事情,我是坚决做减法止损,这样可以把最多的资源投入到擅长的,有兴趣的,可能也是成功率最高的事情上。
在对一个领域进行研究时,需要阅读许多资料,这时也可以应用哈夫曼编码的原理,将更多的时间投入到核心文档上。
罗昭锋老师在介绍如何高效阅读文献中就提到了这种方法,在用endnote能过关键词下载了几百甚到上千篇文章后,第一轮先看过所有标题确认可能有用的,第二轮通过摘要进一步确认哪些比较重要,最后再看全文了解论文的核心。这样大概率不会错过重要文献,又能把时间集中在核心文献上。
比起风险投资,大部分人还是更容易接触到指数基金投资。在指数基金投资时,一种常用的方法就是定投,比如把资金分为100份,每周投入一份到基金中,这种方法平均年化参有10%以上。
但其实我们可以应用哈夫曼编码原理来改进我们的投资策略。也就是每周不再定额投资,而是根据投资当日的指数在整个历史周期中的相对地位来调整份额。
比如像上面的风险投资一样,我们把资金分成400份,在投资日指数处于历史指数25%-50%分位线时就投入2份,而低于75%分位线时就投入8份。
由于在指数较低时投的资金更多,这种方式的收益也就比普通的定投高。
参考资料
- 吴军,《信息论》-07课,得到
- 罗昭锋,《文献管理与信息分析》-第七周《高效阅读文献》,中国大学MOOC