数学的魅力就在于将复杂的问题简单化。全书的思想——简单即是美。
数学的来源
文字是出现在远古“信息爆炸”导致人们的头脑装不下这些信息的时候,数字是出现在人们的财产多到需要数一数才搞清楚有多少的时候。语言和数学的产生都是为了同一个目的——记录和传播信息。不同的文字系统在记录信息上的能力是等价的。文字只是信息的载体,而非信息本身。
语言是为了人类之间的通信。通信的本质就是一个编解码和传输的过程。字母(或者中文的笔画)、文字和数字实际上是信息编码的不同单位。任何一种语言都是一种编码的方式,而语言的语法规则是编解码的算法。
自然语言从它产生开始,逐渐演变成一种上下文相关的信息表达和传递的方式,因此让计算机处理自然语言,一个基本的问题就是为自然语言这种上下文相关的特性建立统计语言模型(Statistical Language Model),它是今天所有自然语言处理的基础。一个句子是否合理,就看它的可能性大小如何。至于可能性就用概率来衡量。利用统计模型进行自然语言处理,而这些语言模型是建立在词的基础上,因此词是表达语义的最小单位。
信息熵不仅是对信息的量化度量,而且是整个信息论的基础。它对于通信、数据压缩、自然语言处理都有很大的指导意义。信息熵的物理含义是对一个信息系统不确定性的度量,在这一点上,它和热力学中熵的概念有相似之处,因为后者就是一个系统无序的度量,从另一个角度讲也是对一种不确定性的度量。
教育
首先,小学生和中学生其实没有必要花那么多时间读书,而他们的社会经验、生活能力以及在那时树立起的志向将帮助他们的一生。
第二,中学阶段花很多时间比同伴多读的课程,上大学以后用很短时间就能读完,因为在大学阶段、人的理解力要强得多。
第三,学习(和教育)是持续一辈子的过程
第四,书本的内容可以早学,也可以晚学,但是错过了成长阶段却是无法补回来的。
一个人想要在自己的领域做到世界一流,他的周围必须有非常多的一流人物。真正做好一件事没有捷径,离不开一万小时的专业训练和努力。
互联网
互联网虽然很复杂,但是说穿了其实就是一张大图而已——可以把每一个网页当做一个节点,把那些超链接(Hyperlinks)当作连接网页的弧。有了超链接,我们可以从任何一个网页出发,用图的遍历算法,自动地访问到每一个网页并把它们存起来。完成这个功能的程序叫做网络爬虫(Web Crawlers),有些文献也称之为“机器人”(Robot)。在网络爬虫中,人们使用一种“散列表”(Hash Table,也叫哈希表)而不是一个记事本记录网页是否下载过的信息。
智能手机的定位和导航功能只有三项关键技术:
第一,利用卫星定位
第二,地址的识别
第三,根据用户输入的起点和终点,在地图上规划最短路线或者最快路线
有限状态机是一个特殊的有向图,它包括一些状态(节点)和连接这些状态的有向弧。每一个有限状态机都有一个开始状态和一个终止状态,以及若干中间状态。每一条弧上带有一个状态进入下一个状态的条件。使用有限状态机识别地址,关键要解决两个问题,即通过一些有效的地址建立状态机,以及给定一个有限状态机后,地址字串的匹配算法。
读后感:第一遍快速的浏览下来,之所以叫数学之美,大概就是我们平日里生活的一些认为高深的问题,都可以用数学模型来解决。这让我想起了xdite老师说的套路,其实这种模型也是一种套路,我们会用一些固定的模型来解决复杂、未知的事情。越来越发现模型对于学习的重要性,学习真的不是登山,而是拼图。有了模型之后再扩展成更大的模型。