这是老卢坚持100天微商笔记整理的第41天!
这篇文章跟你说一说,我们读的那些小说,在感性的文字背后,还隐藏着怎样的数学规律和理性之美。
今年2月份的《科学美国人》杂志刊登出一篇文章,综合了两份关于文学作品的研究报告。这两个研究都是用数学方法去分析文学,这种理性和感性的碰撞研究,得出的结果非常有意思。下面给你具体说说。
首先,原来小说中的情感走势和悲喜变化,都是有套路的,而且只要六种套路就能基本概括。美国佛蒙特大学做了一项研究,他们从世界上第一个数字图书馆计划“古登堡计划”中,选取了1327部10万字以下的英文虚构小说,然后将小说的情绪变化可视化,也就是根据所用词语的情绪高低,或者说悲喜程度,画出了小说从开篇到结尾的情感走势图。
这一千多本小说的走势图画下来,他们就发现,其中有大约85%的小说,它们的情感走势都属于以下六个类型之一:
第一种被称为“麻雀变凤凰”型,情感走势图是一条从低到高上扬的弧线,就是开头悲苦、结尾喜悦;第二种是典型的悲剧型,弧线从高滑到低,意味着喜剧开头、悲剧结尾;第三种,是两头高中间低,形成一个U形,就是开头喜悦,中间经历了悲惨,最后再欢喜收尾;第四种和第三种相反,是两头低、中间高的拱桥状,意思是悲伤开头,中间欢喜,结尾再跌回到悲伤;第五种就像大写的英文字母N,从低处开始,经历一起一落,最后再升高,喜剧收尾;第六种又和第五种相反,一开始就在高昂的情绪上,先降再升再降,最后悲剧结尾。
佛蒙特大学的研究人员把这三对大致两两相对称的弧线,称作小说的“情感弧线”。可别小看这六条简单的弧线,大量数据就摆在这里了,绝大多数小说都跳不出这六种套路。
关于小说的数学规律,还有另外一个有意思的研究,来自波兰的核物理研究院。你看,核物理研究院来研究文学,本身就够有趣的吧。他们选取了113部由不同语言写成的文学名著,从头到尾分析它们的句子长短排列,并根据句子的长度画出了柱状图。他们观察这些密密麻麻排列的柱子,看它们的波动规律,发现这些统计图经常能形成分形图案。
什么叫分形图案呢?简单说来,就是一个整体的几何形状,它由好几个小部分组成,这些小部分的形状跟整体的形状一样,或者至少是非常类似。我们举个例子,一棵西兰花,你掰下其中一小朵,会发现这朵西兰花的形状跟整棵西兰花很像,再从这一小朵上掰下更小的分支来看看,它的形状还是像整棵西兰花。分形图案就类似这样,一层一层地嵌套下去。
在这个研究中,统计图形成了分形图案,这意味着什么呢?比如说,一篇小说的句子长短排列顺序整体呈现出了一种规律,我们放大一点看其中的某一章,这一章的句子长短也呈现同样的规律,再从这一章里面挑一节来看,这一节的句子长短还是差不多的规律。而且,意识流小说和传统类小说还不一样,意识流小说的统计图呈现出了更加明显的分形图案,也就是说,意识流小说更符合这个特点,而传统小说的特点就没有那么明显。
你要问了,我们用数学方法研究文学有什么用呢?佛蒙特大学的研究人员说,通过研究人类基因组计划中的海量数据,人类已经发现了大量前所未知的、关于基因的知识,那么同理,用提取数据、理性分析的方法来研究文学,或许也能发现更多关于文学作品的秘密。
以上就是文学作品中的数学规律新发现,希望对微商人有一定参考价值。
本文源自:《科学美国人(Scientific American)》2017年2月刊 Great Literature Is Surprisingly Arithmetic
原文来自:微商充电:数据挖掘:文学的六种情感弧线
本文链接:http://www.laoluv.com/weishang-chongdian/702420170301.html
百度“老卢微商”,了解更多微商的消息。阅读原文:https://zhuanlan.zhihu.com/p/25510486