一个质量问题,一年时间被客户投诉两次,直到最近,才发现了一个致命的bug,真该好好反思。
问题是这样的,产品寄存器中写入一些固定信息,有一定概率的写入错误,在最终测试环节,通过软件自动化比对,可以将这部分信息错误的产品拦截。但是最近才发现,这个检验功能是失控的。错误的信息仍能pass。可为什么这么明显的一个bug,要快两年才发现?
带有信息比对功能的自动化测试台位要求比较高,必须关联工单才能测试。因为觉得配置工单信息很麻烦,所以失效分析时都不用自动化台位,导致失效分析环节,一直在猜测。凭借“经验”,认定软件有此检验功能,一定能拦截,那么问题产品肯定是检验合格之后出错的。直到排查软件时才发现信息检查并不全面,大量字节的比对功能缺失,导致有些信息错误的产品不能被拦截。
这让我想到了问题分析过程的“三现主义”。即发现问题,立刻到“现场”,确认“现物”,探究“现实”。我们在失效分析过程中有太多的猜想和假设,未复现问题,只有假设和理论,都是空谈。
什么是三现主义?现场,现物,现实。
1. 现场:指的是发生事件或事物状态所处的场所及环境,不能轻易用图片或视频取代;
2. 现物:指的是研究、分析及所要解决的实际本体,不能轻易用复制品或其他类似品替代。
3. 现实:指的是通过现场的实物观察、分析得出问题的根源与结论,并根据实际情况采取措施,数据及分析是基础。
自古到今,三现主义时时刻刻出现在我们身边。“百闻不如一见”,“没有调查研究就没有发言权”,“高高在上三个月都未能弄懂的事,深入基层三天就能知晓”。中医看病需要望闻问切,这些都是三现主义的体现。能到现场去比坐在办公室要好;能询问当事人比自己猜测要好;能加上自己动手操作比只听要更好。
三现主义的核心价值是什么?
1. 三现主义是与一切掩盖问题真相的事物做抗争。问题分析与解决就是要抽丝剥茧,直到找到问题真相。三现主义可避免走弯路。就像前文所讲的信息比对案例,走弯路不但浪费了时间,还隐藏了问题的真相,长期难以被发现。
2. 三现主义是与惰性做抗争。到现场去,是问题分析与解决的前提,这就意味着要勤快。包括调查分析的人,解决问题的人,尤其是做决策的人。这也是为什么自古帝王微服私访,现今好官体察民情,都被百姓津津乐道。
3. 三现主义是与现有经验做抗争。经验很重要,但过分的依赖经验,也会阻碍问题的分析。在调查问题时,要讲究“经验归零”,不能过多的凭借直接及经验,而是是要基于数据和现实。