豆瓣图书评分和推荐靠谱吗？ —— 一点数据分析的视角

豆瓣读书的评分有非常非常明显的分野，具体是哪个时期我没有详细考证，但豆瓣的老用户，尤其是经常使用豆瓣读书的用户都应该有个类似的体验：某一天，你在豆瓣读书上的新书推荐看到了一本貌似很有意思的，评分很高的书。你把它买回家，读后却非常失望。至此，你突然意识到，某个时期之后出版的新书，它的豆瓣评分都是不可信的。

譬如《未来简史》这本书籍，我之前看过这部书，觉得并不好看，对不起8.5的高分。看了goodreads，发现评分也只有3.69星，并不像豆瓣这样高（图一），就国内外对此书评价差别还挺大的。

图一：豆瓣评分

而且，在亚马逊上还能看到截然相反的短评，有的人觉得这是“靠谱的未来预测”，有的却说这本书籍"哗众取宠，没有科学支撑" （图二、图三）

图二：亚马逊读者评论1

图三：亚马逊读者评论2

另一方面，豆瓣上同样8.5分的书籍，比如《九故事》，《悟空传》，《庆余年》，我都觉得挺好看的，goodreads也都达到了4.15星的水平。于是就有疑问，豆瓣书籍的评分是否可靠？会不会存在一些很多书籍的评分不中肯，影响的因素主要是哪些？针对此，我选取了部分不同年代，国内外不同出版社的不同书籍做了对比。

1. 数据概况

选取2001-2017,国内出版的书籍。限制豆瓣评分人数在2W以上，一方面讨论大家较为熟悉、主流的书籍，另一方面也尽量减少水军等的影响。总共997本。通过借助中信云机器学习平台，我们对其中书籍的评分做了比较和展示，其评分分布图如下（图四）：

图四：同一类型书籍评论与方差总览

图四：同一类型书籍各级评价与方差分览

包含了很多我们耳熟能详的书籍，比如围城、肖申克的救赎、百年孤独等等（下图五）。

图五：各出版社评测模型书籍

同时，我们通过应用中信云机器学习平台，对包含中信图书出版社在内的其它出版社出版的小说书籍，做了方差和评级分布图（如下图六所示），我们可以看到，中信小说的评分方范围在7分以上，STD差距主要分布在1.5-1.75之间，那让我们来看分析一下，到底评分的差异来自于什么？

图六：中信小说出版舆情指标概览

2.评分的差异

2.1 未来简史VS时间简史

图七：评分对比图

以上两本书（图七）的评分为例，两者评分相同，评价人数也很多（6K, 18K），但4星和2星的比例差别很大。什么意思呢？

● 时间简史：大家都觉得不错，所以评分集中在了4星

● 未来简史：同时有不少人觉得不错/较差，在2星和4星有不少的分布。

也就是说，尽管两者（平均）分数相同，但是背后的看法非常不同，评分差异很大，这也正好对应了上面，未来简史出现两种截然相反的热评的情况。

2.2 怎么衡量评分差异

评分分布的差异，可以用方差来衡量，计算方法如下：

图八：方差计算方法

也就是计算评分偏离平均分的程度 。下文使用标准差（STD），方差开方即可。可以做出标准差（STD） - 豆瓣评分（Rating ）散点分布图（图九）。为了便于比较，做标准差97%范围线。

图九：散点对比图

可以看到时间简史和未来简史的STD差别确实很大，未来简史的标准差排在前3% ，争议性是巨大的，而时间简史则小很多。那么我们可以设问

这些小说的分数相同，但同样好看/不好看吗？

比如，时间简史和的未来简史分数一样，但他们一样好看吗？

当然不是。

如前面的比较，未来简史虽然评分较高，但其4星/2星和时间简史差别很大。为什么呢？大家可能早有耳闻，看评论也能看到。通常，我们总是在讨论一本书籍评分的高低，只是平均分，当大家看法一致的时候，这个分数会很有参考价值。如果当评分差异很大（STD很大）的时候，这个分数的作用就有限了。

3.类别的差异

对于同一类别，不同的出版社，评分和标准差之间存在较大的差异，那么，对同一出版社，不同类别的书籍的评分，会有多少种形状呢？我们选取了中信出版社的图书部分做了数据分析，用K-Means，输入数据为四个评分等级的比例。实际可以把类别分得很细，这里简单分成4种，比较有代表性，结果如下（图十、图十一）

图十：中信图书舆情分类

图十一：中信图书舆情分类

需要注意的是，高STD的书籍因为其形状差异很大，并不适用于进行分类判定。

从上图看出，在每个形状下，也能看到STD高/低的书籍，比如人人都该买保险，二手时间等等，综合来看，中信出版的图书在评分的7.6-8.8的书，STD都是比较稳定的，没有波动特别大的情况，所以类别之间的评分差异其实相差也不大。

4. 爆款图书评分的差异

我们针对中信出版社的历年舆情变化，图书爆款做了类比（如图十二）。

图十二：中信舆情变化趋势

爆款数量变化如下图（图十三）

图十三：中信爆款图书变化趋势

从图十二、图十三我们可以看到，中信出版社历年爆款图书大致呈正态分布，说明使用的数据量基本足够。各个年代的爆款数量并没有一定的规律性。那对应的爆款书籍舆情分布又是怎样呢，如下图十四所示，

图十四：中信爆款图书舆情分布

上图显示，中信爆款书籍的STD展示效果主要集中在1.3-1.6之间，对于这部分书籍我们取出部分在图下进行了书籍展示（如图十五）

图十五：爆款又好评的书籍

从上图可以看出，经典书籍的评分和STD高度相关，评分高，STD会比较低。也就是说，尽管书籍评分是非常个人化的事情，每个人对书籍的评价会有所差别，但是放到豆瓣的大用户量下，评分的大众性很强，经典书籍的评分STD还是很小的。也就是说，书籍的评分和出版的时间，爆款的程度没有正相关的联系。

5.评价差异最大的书籍是什么？

从上图我们看到各个评分的STD都有高有低，那么我们看一下STD的最大临界值是怎样的一个情况，从样例中，我们进行了STD差异最大的书籍进行了筛选，如下图所示：

图十六：争议前十的书籍

评价差异大的原因可能来自多个方面，这里我们就不进行讨论了。

6.搜索内容相近书籍和评分是否准确？

图十七：高手寂寞

大家如有看过兰大的高手寂寞之类的书籍，是否会有想继续找一些在内容和评分，以及评级上都能够与之媲美的书籍？豆瓣本身是有推荐机制的，如下图所示：

图十八：高手寂寞相似书单匹配

图十九：相似书单推荐评分

我们可以看到，豆瓣关联推荐的书籍，在评分、评级、内容上有些和目标书籍相差有些大，为验证评分和评级的相似性，我们在中信云机器学习平台上，对豆瓣图书进行相似度建模，通过word2vec解析，来找到和目标书籍内容，评级，评分等最为接近的书籍。

图二十：通过相似度建模进行相似数据检索

例如输入硅谷钢铁侠，我们通过对硅谷钢铁侠的数据标签进行建模解析，查出最接近此书内容的词云如下图（图二十一）所示。

图二十一：word2vec词云展示

我们从豆瓣查出两本书的评价情况，评分和评级构成都是极为相似。

图二十二：硅谷钢铁侠豆瓣评分

图二十三：鞋狗书籍豆瓣评分

在推荐的时候，查询鞋狗，第一关联也是能看到硅谷钢铁侠名列前茅，豆瓣的推荐和机器学习实测的推荐是相吻合的。

图二十四：查询鞋狗相似度推荐

总结

豆瓣的图书评分，大家都知道是显示的平均分，也都能看到分数的分布情况，在大多数情况下，这个平均分是有效的，因为大家的评价较为接近（STD较小），但是很少有人注意到评分的分歧大小（即STD的大小），当看到一部STD很大的书籍，平均分和我们感受不符时，我们会感到疑惑，进而觉得豆瓣的评分不靠谱，实际上，只是因为人民的评价差异太大（STD太大），使平均分的意义变得有限了而已。

豆瓣的图书推荐，通过对目标图书的内容标签，评分构成和区间等进行综合对比，从而推荐和目标图书最相近的书籍，从目前的机器学习测量样本数据观察，这个评分是比较准确的。

最后，分析有什么疏漏，或者没讲清楚的地方，也欢迎大家指出~

安利一下:中信机器学习平台，有兴趣的朋友可以注册登陆试用一下。

最后编辑于：2018.10.12 17:52:31

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,732评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,496评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,264评论 0赞 338
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,807评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,806评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,675评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,029评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,683评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 41,704评论 1赞 299
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,666评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,773评论 1赞 332
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,413评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,016评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,978评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,204评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,083评论 2赞 350
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,503评论 2赞 343

豆瓣图书评分和推荐靠谱吗？ —— 一点数据分析的视角

推荐阅读更多精彩内容