从2019年底至今国内遭受新冠病毒侵袭,举国上下同心共战“疫”!大家也都注意到了,除国家每天都会公布疫情最新数据外,各大互联网公司也都发布了“疫情地图”,支付宝首页、微信的“医疗健康”、百度首页等等每天都会更新“疫情数据”,让大家能够更加清晰直观地了解疫情状况。那么这个“疫情地图”是如何产生的,你知道吗?今天我就简要和大家介绍下整个技术流程。
数据来源
国家卫健委、各地方卫健委每天会在其官网公布最新疫情数据,这是最权威的数据来源,无论是支付宝、微信、百度的疫情地图旁边都能找到类似 数据来源:根据国家卫健委、各省市区政府卫健委。。等字样,卫健委公布的数据就是他们的数据来源。
数据采集
上图是国家卫健委公布的截至2月25日的疫情情况。想象一下如何在Excel去制作一个柱状图或者饼图,直接把这些文字拷进Excel里是没有办法生成一个图表的。同样的,制作“疫情地图”也需要类似下图的结构化数据(当然实际这些数据是存储到数据库的)。
那么如何去各个卫健委网站整理这些数据呢?最笨最耗时的办法当然就是人工每天去浏览每个网站,自己整理出这样的数据。显然这样做耗时耗力又容易出错。实际应该是通过 网络爬虫,让程序每天自动的去抓取各网站数据,然后自动整理,自动写入数据库。这就需要程序员去写这个爬虫的程序去实现这些功能。
数据展示
好了,现在已经有了结构化的数据,并且已经存入了数据库。接下里就是如何制作上述提到的数据地图了。实际上已经有很多成熟的前端框架(例如百度的Echarts,高德地图,等等
),只要把数据按要求“灌入”这些框架中,自然就能呈现出各种效果了。当然这个过程需要写后端代码去获取数据库里数据返给前台,前端拿到数据后也需要写相应代码去实现这些功能。
图片源自网络,侵权必删!