20秒纵览中国大学学术排行榜变化

微信公众号原文链接

在感叹的同时,小笨聪也很好奇这类可视化图表是怎么制作的?便找到了作者 Jannchie见齐的 B 站主页:

哔哩哔哩 ( ゜- ゜)つロ 乾杯~ Bilibili​space.bilibili.com

点进去发现还有大量此类有趣酷炫的视频。


嗯,俺也想学!

那他是怎么实现的呢?原来他用到了一个动态图形显示数据的 JavaScript 库:D3.js。那么,如果不会 D3.js 是不是就做不出来了呢?当然不是,Jannchie非常 nice 地给出了一个手把手简单教程:

见齐 手把手教程

最主要的,他还开放了程序源码,只需要做2步就能够实现:

到他的Github主页下载源码到本地电脑:https://github.com/Jannchie/Historical-ranking-data-visualization-based-on-d3.js

打开文件夹里面的exampe.csv文件,放进你想要展示的数据,再用浏览器打开bargraph.html网页,就可以实现动态效果。只不过要注意使用的数据格式要求。

下面是小笨聪的实例运用。首先爬取大学排行榜的数据并做处理,然后利用源码将数据可视化。

先提前感受一下效果


1.大学排行榜数据爬取

(1)数据来源

世界上最权威的大学排名有4类,分别是:

原上海交通大学的ARWU(软科)

http://www.shanghairanking.com/ARWU2018.html

英国教育组织的QS

https://www.topuniversities.com/university-rankings/world-university-rankings/2018

泰晤士的THE

https://www.timeshighereducation.com/world-university-rankings

美国的usnews

https://www.usnews.com/best-colleges/rankings

这里,我们选取相对比较权威也比较符合国情的第一个 ARWU 的排名结果。打开官网,可以看到有从2003年到2018的英文版和中文版排名,这里选取中文版。

确定好数据来源,然后就可以把数据爬取下来啦。

(2)分析URL获取内容

网页的URL 还是很简单的,随着年份变化而变化,我们抓取十年的数据,只需在 main 里构造一下 for 循环,url 格式如代码里所示。另外,需要注意,不同年份网页采用的编码不同,返回 response.test 会乱码,返回response.content 则不会。

(3)解析表格

使用read_html 函数抓取表格,并对表格进行必要处理。


此时的表格数据并不完整,因为没有将国家抓取下来。国家在网页里使用图片表示的,因为我们可以定位到国家代码位置。

可以看到美国是用英文的USA表示的,那么我们可以单独提取出src属性,然后用正则提取出国家名称就可以了。

(4)数据处理

将前面生成的 university.csv 文件进一步处理。另外,这次的代码不仅可以获得内地大学排名,还可以列出含港澳台的排名和美国大学的排名。小笨聪也定义了一个 topn 函数,能够按年份分别求出各年的前20名大学名单。


获取的表格数据效果如下:

2.数据可视化

首先到 见奇 的 Github 主页下载源码,然后将 bargraph.html 拖拽到浏览器,点击 选择文件,将刚才下载好的 university_ranking.csv 文件选中,即可看到动态数据图表。

不过还是有一些需要完善,比如字体大小、柱形颜色、数据项位置、图表反转等等,这些参数在源码的文件里均可以修改。当然,比较方便的办法是可以先在该网页的 css 样式表里改,改好后再到源码里修改。

源码有四个方便修改参数的文件:

config.js : 配置各功能的开关,比如配色、字体、是否反转图表等等;

color_ranges.js : 修改柱形图的颜色;

stylesheet.css : 具体修改配色、字体、文字名称等的 css 样式;

visual.js :更进一步修改,比如图表透明度。

当然,如果你比较懒,我已经帮你修改好啦(其实也并不是很容易修改...)。

以上就是本次爬取大学排行榜数据并制作动态图标的分析过程。

微信公众号“学编程的金融客”后台回复“大学排行榜”即可获取源码。

微信公众号原文链接

往期推荐

1.流浪地球影评

2.北上广深租房图鉴

3.图虫网美女

4.猪小屁视频

5.母亲节祝福代码

你的点赞和关注就是对我最大的支持!

http://weixin.qq.com/r/EDl2bvHEkKzvrbUN92wC (二维码自动识别)

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,293评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,604评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,958评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,729评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,719评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,630评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,000评论 3 397
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,665评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,909评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,646评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,726评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,400评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,986评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,959评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,996评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,481评论 2 342

推荐阅读更多精彩内容