记一次基于项目建设的数据分析-劳保用品分析

近期在任职的公司启动劳动防护用品系统的建设,寄希望通过劳保系统的建设从新梳理内部劳保用品的标准、实现情况、规范劳保用品业务后期相关操作,明确责任主体工作,在劳保管理系统建设期间启动了多次对业务数据的清洗和分析工作,所以萌生了写此文的想法。
数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解消化,已求最大化地开发数据的功能,发挥数据的作用,在本次劳保用品分析工作中总共包括三大主要工作:1、现状分析,2、原因分析,3、预测分析。
1、现状分析,现状分析就是告诉用户过去发生了什么;
2、原因分析,就是想要告诉用户某一个事情为什么发生;
3、预测分析,就是告诉用户将来发生什么。

做任何事情之前都要先明确目的,数据分析的目的不是做出了多少数据,做了多少张好看的图表,要解决的事情是:降低费用,规范相关制度,规避系统上线因为数据带来的大部分问题。
明确了目标然后是确定方法,本次数据分析采用的是逻辑树分析法,使用逻辑树分析能保证解决问题的过程的完整性,它能将工作细分为便于操作的任务,确定各部分优先顺序,明确地把责任落实到个人,这也是使用逻辑树的主要原因。
确定方法之后是数据收集,数据收集是按照确定的数据分析框架,收集相关的数据的过程,它为数据分析提供了素材和依据,本次数据收集包括2部分内容:1、数据库,劳保用品在2019年6月前有系统做支撑,可以有效的利用起来;2019年6月-12月有ERP系统出入库做支撑。2、电子凭证,excel的发放记录。3、标准的制定,excel整理,制定的excel模板如下:


未命名图片.png

图1-发放纪录模板


未命名图片1.png

图2-物料主数据模板


未命名图片2.png

图3-劳保类型模板


未命名图片3.png

图4-套餐标准模板


未命名图片4.png

图5-岗位与套餐对应关系模板
数据处理,数据处理就是数据拿到后该怎么办?要怎么处理?要提炼出哪些信息出来?需要给用户展示哪方面的结果。虽然前期制定了数据模板规定了字段的格式,数据会是你想要的样子吗?我们这次遇到的就是这种杂乱无章、残缺不全的数据,这个时候就需要有清洁工的精神,一点一点将它弄的井井有条、干干净净。数据处理按照步骤总共可以分为两步:数据清洗与数据加工。
第一步数据清洗
数据清洗就是将多余重复的数据筛选清楚,将缺失的数据补充完整,将错误的数据纠正或删除
1、重复数据处理,对于发放纪录,分析之后的数据只要最后一次领用纪录,需要将历史领用纪录筛选处理,并进行删除操作,具体的删除逻辑不在这里进行详细介绍。再进行文件导入之前手工处理了一下数据,收集的发放纪录是身份证号,新上线的系统使用工号,用excel进行手工匹配后导入,用到了excel中一个比较重要的函数就是VLOOKUP函数,它可以用来核对数据,多个表格之间快速导入数据等函数功能。功能是按列查找,最终返回该列所需查询序列所对应的。


未命名图片5.png

图6-重复数据处理代码


未命名图片6.png

图7-vloopup匹配工号
2、缺失数据处理,缺失数据是指数据集中某个或某些属性的值是不完全的,主要分为机械原因或者人为原因。对于本次数据分析工作来说这部分数据问题是提供的发放纪录不包括公司所有人员,缺失的人员发放纪录如何补充完整。期初数据导入到系统后点击刷新标准,没有提供期初的人员也会刷出按照标准的物料。


未命名图片7.png

刷新完劳保标准之后select t.*,t.rowid from LP_CG_STANDARD t where t.pre_dt is null查询领用时间缺失的人员相关信息,找负责提供领用信息的人员补充缺失的领用时间。


未命名图片8.png

在导入期初数据时领用时间没有按照要求的格式提供,手工在excel进行了格式化处理。


未命名图片9.png

3、错误的数据纠正或删除,错误数据一般是怎么出现的?以这次劳保用品分析为例,一边拿会有两种错误形式:与标准不匹配和领用时间错误。
对于第一种与标准不匹配的领用信息数据导入时时生成报错日志,可以通过select * from LP_ERRORIF查询


未命名图片10.png

对于第二种领用时间错误的,系统通过领用时间+计算周期得出下次领用时间,使用润乾报表做了一个二维统计表,使用交叉分析法帮助用户发现潜在问题并解决。交叉分析法通常用于分析两个变量(字段)之间的关系,就是将两个有一定联系的变量及其值交叉排列在一张表格内,使各变量成为不同变量的交叉结点,形成交叉表,从而分析交叉表中变量之间的关系,表左侧是物料名称,右侧是月份。


未命名图片11.png

工作进行到这一步现状分析和原因分析就都做完了,然后是预测分析,也就是数据展示,结合系统运行的要求需要对以下内容进行预测:按年的需求量预测(提前通知供应商备货 )、整单兑现率(评价供应商供货能力)、劳保用品统计(按年度统计劳保费用)、形成两个清单洗漱用品清单和衣服特体清单。
数据展示不一定都要用图表,按年的需求量预测使用突出显示的单元表格更为合适,具体如下:


未命名图片12.png
未命名图片13.png

整单兑现率采用结构分析法,属于相对指标 兑现率=(不重复需求计划号/需求计划号)×100%

未命名图片14.png

本次劳保用品分析工作经过现状分析、原因分析、预测分析就全部结束了,专业是一种长期的修为,不是一时一刻就能达到的。所以永远不要满足与现状。‘路漫漫其修远兮’,要不断努力,怀揣永不厌倦的好奇心和进取心,才能走向卓越。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,921评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,635评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,393评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,836评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,833评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,685评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,043评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,694评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,671评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,670评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,779评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,424评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,027评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,984评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,214评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,108评论 2 351
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,517评论 2 343