工具方法篇统计过程控制SPC 第2部分
有感于很多公司对SPC应用中的一些误解和难点,本篇文章主要以第二版《统计过程控制SPC参考手册》第一章的内容为基础讲解SPC,力求将SPC内容简单化和通俗化,既可以当作通俗的SPC入门读物,也可以当作学习SPC的参考书,起到对比和参照作用。尤其是对SPC有深入研究的人员,相信这篇文章会给你惊喜和启发。因为“五大工具”从英语翻译为汉语,很多语言习惯可能不太适合中国人的理解,并且由于专业词汇的翻译难度,导致五大工具的参考手册学习起来不是那么容易,尤其是有些内涵和经验技巧没有充分地表达清楚。本文为“质量管理之行”原创,首发于微信公众号“质量管理之行”。
SPC参考手册的内容中对应用技巧和实践经验总结非常到位,并且涉及了很多基本原理和基础概念,只是因为文字简练,导致内涵不容易被重视和理解。尤其是从应用层面和实践层面来说,SPC参考手册是一本非常有价值的指南或参考书,是对SPC相关理论知识的有效且有力的补充。
本篇文章不对SPC的最基础且最容易理解的内容(比如单纯的数学或统计内容,以及公式计算等)进行讲解,只对重要的,关键的,有内涵的内容进行说明,重点解释SPC的应用技巧和注意事项,并对手册的内容进行一些拓展。为了有利于对照SPC参考手册学习和使用,本篇文章的内容的顺序按照第二版SPC参考手册的内容顺序排列。蓝色字体为SPC参考手册的原文。
因为SPC有很多容易误解的地方,甚至还有“争议”,当然这种争议一般都是“公说公有理婆说婆有理”式的各执一词而已;所以为了增加文章的可信度,本篇文章引用了很多权威的参考资料,除了补充SPC参考手册中的内容外,主要是为了起到论证的作用,用客观证据或资料给出可信的“答案”,让大家对正确的概念和知识更加坚定。本篇文章的大量资料和讲解会对理论知识的提升有一定帮助,相信会提升对SPC知识正确与否的分辨力。
对于有些理论知识,只有用长篇文章才能描述清楚。本篇文章大约27000字,耐心阅读效果更好。这么长的文章好像在写书一样,只不过没有在出版社出版,是在微信公众号上“出版”了而已。另外,微信公众号增加了评论功能,欢迎大家阅读文章后参加评论。
目录
第一版和第二版前言
第一章 持续改进和统计过程控制
---介绍
---六点说明
第一章 第A节 探测和预防
第一章 第B节 过程控制系统
第一章 第C节 变差的普通原因和特殊原因
第一章 第D节 局部措施和对系统采取的措施
第一章 第E节 过程控制和过程能力
---控制与能力
---短期过程能力(指数)和长期过程能力(指数)的区别
---CPK和Ppk哪个更大?
---过程能力指数计算的取样周期
---如何使过程得到控制?
---过程的分类
---过程指数
---过程指数的作用或应用
第一章 第F节 过程改进循环及过程控制
---分析过程
---维护(控制)过程
---改进过程
第一章 第G节 控制图:过程控制和改进的工具
---两类错误
---如何探测和识别特殊原因
---它们(控制图)如何工作?
---建立控制图的方法
---控制
---控制图的控制限的修改
---第一章 第H节控制图的有效使用和益处
第一版和第二版前言
如果每个顾客都使用自己公司的习惯语言或术语对供应商进行要求和审核,那么会给供应商造成很多的不便,也不利于顾客和供应商的沟通。为了简化并减少对供应商质量要求的差异,美国三大汽车公司编写了包括SPC参考手册在内的“五大工具”。“五大工具”一个很重要的作用就是对供应商评定系统中的语言和术语进行标准化处理,便于供应商可以使用SPC等参考手册同时满足三大汽车公司的供应商评定系统的相关要求。
本手册是对统计过程控制的一种介绍,但是因为各公司的过程和产品的不同,本手册不能涵盖和指导所有的情况,也不诣在综合所有的SPC技术,所以本手册不限制适用某特定过程或商品的SPC方法,或者说公司/组织可以根据自己的实际情况去应用本手册内容之外的适用的统计方法。
既然是美国三大汽车公司开发的SPC参考手册,以便用来管理其供应商,所以这本SPC手册主要是根据汽车行业的特点和需求进行编制的。本文为“质量管理之行”原创,首发于微信公众号“质量管理之行”。
第一章 持续改进和统计过程控制
介绍
要想达到顾客满意的目标,就需要对产品和服务的价值进行持续改进。达到目标和有效的改进就需要有合适的方法,而本手册描述了几种基本统计方法,可以使改进更有效。
本手册适用于刚开始从事统计技术的员工和管理者,属于SPC的入门级教材,并没有包括所有的基本方法和高级方法。
六点说明
这本手册的编写者没有把这本手册抬得很高,而且作了很多说明,生怕误导这本手册的使用者。编写者们好像也很谦虚,毕竟和专门搞研究统计学的专家教授们比起来,在理论层面不一定能比得过专家教授。但是在理论的具体应用上,可能还是实践者们更有经验。虽然这本手册的编写者们总结了很实用也很有价值的经验和技巧,但还是非常谦虚地说是在和大家“讨论”。
在开始讨论之前,有以下六点需要说明:
1)收集数据和使用统计技术并不是最终目标,真正的目标是通过统计技术实现改进效果。应该将增长知识作为行动的基础,要把理论用于实践,知行合一。
2)数据分析的前提是数据准确,所以在收集数据之前要确保测量系统的适宜性,如果测量的变差在过程的总变差中占很大比例,数据就可能不准确,而数据不准确就有可能作出不恰当的或错误的决定。因此在本手册中,假设了测量系统分析已经处于受控状态,并且对过程总变差没有很大的影响。也就是说应用SPC的前提是先做测量系统分析MSA。
3)研究变差和应用统计技术可以适用于任何领域的改进,比如车间、办公室、行政服务等。比如产品的特性,记账的差错率,销售额等。本手册重点放在车间应用中,对希望在行政管理及服务中应用的读者,建议参考附录H中的参考文献。
4)SPC代表统计过程控制(是“统计过程控制”的简写),但以前的统计方法常用于产品而不是(用于)过程。应用统计技术来控制输出(例如产品或零件)应仅仅是第一步,只有当产生输出的过程成为我们努力的重点,这些方法才能在改进质量、提高生产率、降低成本上充分发挥作用。统计过程控制,顾名思义是用来控制过程。控制过程才有利于得到预期的过程输出。
5)虽然手册中的每一点都通是由经过实践的案例来说明的,但是要真正理解这些知识,读者还需要进一步联系实际工作,因为实际工作经验是无法取代的。
6)本手册可看成应用统计技术的第一步,它提供了被普遍接受的方法,并在许多场合得以应用。然而,还是存在一些例外的情况,在这些情况中,盲目地使用这些方法是不恰当的。本手册不能代替从业者对提高统计方法的知识和理论的需要,我们建议读者寻求正规的统计学教育。当读者的过程和统计方法的应用已经比本手册所述的内容更先进时,我们建议读者向具有一定的统计理论知识与实践经验的人员请教关于其他统计技术的适用性。任何一种情况下,所有的程序都必须满足顾客的要求。
SPC参考手册中的内容如果不适合于公司的实际情况,那就不要随便地盲目地应用这些内容,不要生搬硬套地使用工具方法。如果你自认为你现在使用的统计方法比这本SPC参考手册的内容更先进时,你就先找更有水平的人请教一下,请教的人不但要具备理论知识,还要有实践经验。光懂理论是不行的,只有知行合一才能理论指导实践。要想提高统计技术的理论知识,就去学习正规的统计学。
另外,SPC参考手册因为篇幅所限,更偏重于基础原理和基本概念的介绍,以及对实践经验和技巧的总结,但是解释和案例说明都不算太详细。要想深入学习SPC,建议阅读高等教育出版的第二版《新编质量管理学》。这本书是当时我们学校的教材,本书的主编张公绪教授和孙静教授应该是中国质量管理专业研究的领军人物,编写的著作非常认真和严谨。正是这本书让我在SPC学习方面打下了非常坚实的基础。
第一章 第A节 探测和预防
探测是容忍浪费,预防是避免浪费。从事后发现不合格到事前预防不合格,这需要理念的改变,更需要方法的改变。
检验或检查是用来识别和判断产品是否符合产品规格/规范,是属于对产品合格与否的探测。当检验发现不合格品时,不合格已经发生了,相当于浪费已经发生了,所以仅仅靠检验和检查的质量控制是不能避免和预防已经发生的不合格的浪费。要想避免不合格的浪费就需要提前预防不合格的发生,而产品是过程的输出,只有控制过程才能预防不合格的发生。如何控制过程?这就统计过程控制所研究的范畴,也是统计过程控制SPC的作用和价值。
下面图片是第二版《新编质量管理学》的内容:
第一章 第B节 过程控制系统
过程控制系统可以称为一个反馈系统。因为SPC能利用统计分析来反映过程运行的情况,能提示和预警过程的正常和异常,相当于为过程的调整和采取措施提供了信息反馈,所以SPC也一类反馈系统。
从控制的角度来说,控制需要根据输出(响应)结果的反馈信息来调整输入(激励)和过程,输入和输出之间形成闭环。同理,PDCA也是循环的闭环,也要将检查C的信息反馈给策划D,做出决策后进行A。
下面讨论这个系统重要的四个基本要素:
1.过程---所谓过程是指供应商、生产者、人、设备、输入材料、方法和环境,以及使用输出的顾客等要素的共同作用。过程的性能或绩效取决于供应商和顾客之间的沟通(反馈和闭环)、过程的策划或设计,实施的方式,以及运作和管理的方式等。过程的单个或部分要素只有在整个过程中才能发挥作用,或者说过程是各个要素相互作用的结果,要想让过程维持良好的水准,需要各个要素的共同作用,仅仅靠一个要素或部分要素无法达成整体的过程绩效。
2.关于过程性能的信息---过程本身以及其内在的变化会影响过程的输出(或过程的性能),简单地说就是过程影响结果。过程输出的结果的情况就是过程的绩效(性能)。反过来说,要想提前知道过程绩效(或性能)表现的怎么样?那就需要研究和了解过程的输出结果。既然过程影响结果,那么要想得到好的结果就需要关注过程本身及其变化。过程本身及其变化可以称为过程特性,比如温度、循环时间、产量、延迟和中断的次数等。注意,这里的过程特性需要广义理解,不要局限于工艺参数等过程特性,因为从不同的层次理解,上游层次的过程结果会是下游层次的过程特性。照此理解,过程的输入和输出都是过程的一部分,就像“乌龟图”中的头和尾都属于乌龟。
收集和监测过程特性与目标值的差距的信息,并且对这些信息做出正确地解释,就可以判断过程运行得是否正常。比如过程的产量不高,生产一个产品的标准工时较高,时常停机或延误,这样的过程绩效肯定不算太理想。如有需要,就可采取适当的措施来纠正过程或过程输出。收集关于过程性能的信息就是为了给采取措施和改进提供输入。
举一个例子以便更简单点说,比如一个制造过程总是停机或总是发生延误,这样的过程应该在不正常地运行,这样的过程绩效或过程性能估计也不会太好。像停机次数或延误时间这样的信息就能反映过程是否在运行正常,研究和分析这样的信息并采取纠正措施就能提高的过程的性能。
3.对过程采取措施---为避免一些重要的特性(过程或输出)偏离目标值太远,对过程采取措施往往是比较经济的。这样能确保过程输出的稳定性和变差保持在可接受的范围之内。
过程的输出是产品,产品的特性称为产品特性;产品是输出,也可以说成是输出特性。产品有特性,过程也有特性,所以一般分为产品特性和过程特性。学习和使用过控制计划的应该知道,产品特性和过程特性都需要在控制计划中控制。控制过程才能更好地控制结果,尤其是在产生不合格产品之前就进行预防是更经济的方法。
过程的要素一般包括“人机料法环测”。车间温度、湿度等都属于环境要素。所谓对过程采取措施无非就是改变过程的要素及其相互作用。
4.对输出采取措施---对输出采取措施往往是最不经济的,它仅限于对输出进行探测并纠正不符合规范的产品,而没有处理过程中的根本问题。如果不分析和解决发生不合格的原因,那么就只能被动地挑选产品,并报废和返工不合格的产品。对有不合格风险的产品进行检验或挑选应仅仅是过程不稳定情况下的临时措施,只有分析不合格的原因并采取措施,才能提高效率和降低成本。因此,下面的讨论重点将放在过程信息的收集和分析上,以便对过程本身采取纠正措施。请记住,重点应该是预防而不是探测。在此也可以看出,SPC主要是收集和分析信息,为采取纠正措施或作出决策提供信息输入。本文为“质量管理之行”原创,首发于微信公众号“质量管理之行”。
第一章 第C节 变差的普通原因和特殊原因
没有两件产品或特性是完全相同的,因为任何过程都包含很多引起变差的原因。也就是说任何产品之间都有差异,产品之间的差异有多大?如何衡量产品之间差异的大小?产品之间的差异如果用统计学的术语来说就是产品的变差。
过程及其要素是变化的,所以会导致产品的变化。例如机器和其固定装置间的游隙或间隙,会引起零件间的差异的短期的(变化)、。另外一些变差原因,只有经过较长一段时间后才对输出造成变化,这些变化可能在工具或机器的磨损下逐渐地发生(逐渐的变化)。工艺调整,原材料批次的变化等可能会导致阶段性变化,也就是不同的产品批次之间会发生明显的变化。设备不稳定或动力不稳定可能会造成产品之间不规则的变化。由于变化点的影响,不同的时间下过程的条件可能也是不同的,而不同的过程条件可能会导致产品间明显的差异,所以在不同的时机测量产品时,测量结果会受过程条件的影响而有差异。另外,即便是同样的影响因素,在不同的时间测量或者是测量的周期不同,也会导致明显产品的明显差异。比如易损的工装会影响产品特性,如果在短时间内抽取产品进行测量,工装磨损不会对产品产生明显的影响,产品之间不会有明显的差异,但是抽样的间隔时间比较长,因为工装的磨损程度发生了较明显的变化,所以间隔较长的产品抽样测量结果也会有明显的差异,所以测量的周期也会影响到产品变差的数值。总结地说就是,不同的测量周期和不同过程条件下的产品测量,都可能会对产品变差有明显的影响。
造成变差的来源也可以说成是导致变差的原因,导致产品变差的原因可区分为普通原因和特殊原因。
普通原因---指的是那些始终作用于过程的多种的变差来源。随着时间的推移,一个过程中的普通原因会产生一个稳定的且可重复的分布,我们称之为“处于统计上受控制的状态”、“统计受控”、或有时简称为“受控”。普通原因产生的是一个处于偶然原因下的稳定系统,如果一个过程只存在变差的普通原因且不改变时,该过程的输出是可以预测的。
普通原因的两个主要特征:一是始终作用于过程;二是多种普通原因综合作用在一起只会对产品产生随机的效果。同时满足这两个主要特征才属于普通原因。如果是间歇发生的原因,那就属于特殊原因了。假设一下,如果几个普通原因同时停止作用了,这时的输出就可能在统计上发生明显的变化。
正是因为只处于普通原因作用下的过程输出是随机的,且是稳定的,所以才可以对过程进行预测。反过来说,如果一个过程的输出是不稳定的,是没有规律的,那么就无法对过程输出进行预测。
特殊原因(通常也称可查明的原因)--指的是这样的因素,他们引起的变差仅影响某些过程输出。这些原因通常是间歇发生的,不可预测的。特殊原因的信号是:一个或多个点超出控制限,或在控制限内的点出现非随机的模式。除了特殊原因的文字描述,另外就是在控制图上区分特殊原因。所以从“统计”上讲,只有产品或过程的输出发生明显的变化才能识别出特殊原因。如果有特殊原因,但是识别不出,那就是“漏发警报”。所谓明显变化用统计的语言就是一个点或多个点超出控制限,或在控制限内的点出现非随机的模式。对于直接超出控制界限的情况,除了“虚发警报”外,一般就是特殊原因。但是有时特殊原因也不一定能直接让控制图的点出界,这时就有可能导致了所谓的“漏发警报”。比如,某些特殊原因,虽然是特殊原因,但是对产品的影响可能有时大,有时小,因为其影响程度变化不定所以不容易在控制图上识别出来;还可能是因为特殊原因的间歇发生,所以其对产品造成的影响无法或不容易在控制图上显示出非随机变化。当然,如果特殊原因具备上述两种情况,可能就更不容易识别了。
特殊原因的三个主要特点:一是通常为间歇发生,但也可能是持续发生;二是通常为不可预测,但也不一定不能预测,有时也可以预测;三是通常会对产品变差造成非随机的影响效果。满足其中一个条件就属于特殊原因。只要是间歇发生的或不可预测的,都属于特殊原因,但是特殊原因不一定是间歇发生或不可预测,可预测的也可以是特殊原因,因为特殊原因有时也可以预测,所以在第一章第E节中说:“特殊原因已被识别,其记录表明具有一致性和可预见性”。因为特殊原因的影响程度或影响能力,有的特殊原因在相对的短时间内可能无法产生明显的非随机影响。特殊原因除了文字上的定义和描述外,主要还是从“统计”上去区分。所以学习SPC一定要理论联系实践,有丰富的实际工作经验才能更好地理解理论。
特殊原因通常也称为“可查明”的原因的意思是:如果过程有特殊原因的影响,一般情况下能通过控制图体现出来,或者说通过控制图一般就能知道过程是否有特殊原因的影响。这就是说,过程的输出显示为不受控时就是有特殊原因影响,至于是哪种或哪个特殊原因的影响,不一定能识别和区分出来。“可查明”并不能准确知道具体是什么特殊原因,举个不恰当的例子,一个物品规定了摆放位置,且摆放位置很清晰可视,一般能轻易区分物品是否被挪动。如果物品被明显挪动了或超出了规定的位置,那就很肯定物品被挪动了,这就相当于特殊原因,但是物品是谁挪动的?还是因为环境变化自己滑动的,那就不清楚了。只是知道物品被挪动了,属于异常,但是不一定知道是什么具体原因导致了物品挪动。比如物品在某一段时间内被挪动了,又被恢复了,或者是如此重复进行几次,但是在某一时刻观察其位置变化并不明显,这样的异常或特殊原因就可能无法或不容易被发现。
除非变差的所有特殊原因都被识别出来并且采取了措施,否则它们将会继续以不可预测的方式来影响过程的输出。如果存在变差的特殊原因,随着时间的推移,过程的输出将不稳定。特殊原因通常是间歇发生的,不是持续发生,尤其是发生频次很低的特殊原因,更是很难被识别和具体区分出来。
特殊原因虽然通常是间歇发生,但不一定都是间歇发生,有的特殊原因也可能会持续发生或持续影响过程,比如刀具磨损、刀具重磨等(请参见第一章第E节)。但是,要注意的是,持续发生的特殊原因也不意味着就一定容易识别。就像在实际工作中,有时就算持续发生不合格,也不一定就能轻易找到原因。
特殊原因虽然通常是不可预测的,但不一定都是不可预测,比如有的特殊原因只对产品造成固定程度的影响,虽然在统计分析上属于特殊原因,但它是可以预测的。比如工装定位有一定的偏差,可能对产品的尺寸是固定的影响。就像随机误差服从正态分布,是有规律的可预测,但是其他某些系统误差可能是线性变化,也是有规律的可以预测,所以特殊原因也又可能可预测。比如模具的冷却水没有打开,温度会慢慢升高,这样的异常或特殊原因就有可能是有规律的,也可能是可以预测的。
特殊原因对产品的影响有的有利,有的有害。有害的特殊原因要识别出来并消除掉,有利的特殊原因也要识别出来使其成为过程中恒定的一部分,也就是对有利的特殊原因进行标准化,使其持续发挥有利作用。
对于一些成熟的过程,顾客可能会给予特许,让存在一个稳定发生的特殊原因的过程进行下去。这样的特许通常要求:过程的控制计划能够确保符合顾客的要求,并且保证过程不受别的特殊原因的影响(见第一章,第E节)。这就相当于某些特殊原因虽然在统计上可能不可预测,也可能会对产品造成统计上的明显影响,但是属于已知的和可控的。比如过程性能指数很高,虽然在统计上不可控,但是距离产品规格限的距离是“可控”(这里的“可控”不是指统计上“可控”,是广义的可控,在这里是指可以管控在规格范围内)且可预测的,或者是很少有机会超出产品规格,像这样的特殊原因就可能会被顾客特许接受。在第四版《生产件批准程序PPAP参考手册》之“2.2.11.2质量指数”中这样说到:“对于带有已知的和可预测的特殊原因且输出满足规范的过程,应使用Ppk”。
第一章 第D节 局部措施和对系统采取的措施
局部措施---通常用来消除变差的特殊原因,通常由与过程直接相关的人员来实施,通常可纠正大约15%的过程问题。
对系统采取措施---通常用来消除变差的普通原因,几乎都需要采取管理上的纠正措施,通常可纠正大约85%的过程问题。
下面图片是《质量工程师手册》的内容:
在实际工作中,如果生产制造出现了特殊原因或异常导致了产品不合格,只需解决这些特殊原因即可解决问题,不需要进行全部的调整。如果是由于整个过程的随机综合作用导致,那就只能针对整个过程进行调整。比如为了生产一个新产品而设计了制造过程,调试完成前的过程可能受很多特殊原因影响,需要技术人员进行调试,经过技术人员调试后,该解决的问题也都解决了,过程也处于统计上的稳定状态了,但是在稳定情况下,过程能力CPK只有1.2,要想再提高过程能力,只能从整个制造过程的设计上着手解决,就需要管理者进行决策,是对该过程进行整体升级呢,还是再买个设备呢。解决局部的和技术上或操作上的问题,是由现场相关人员负责,而重新再设计个制造过程,或者是需要重新买个设备,或者是更换更好的原材料供应商,那就属于管理者决策的职责范围。比如在实际工作中,有时相关人员会说,受限于工艺能力或技术条件,或受限于设备的类型和精度等,过程能力只能是这个水平了,要想再提升,只能更新工艺或技术方案或设备等。
如果是受限于过程整体的工艺或技术水平,而不是工艺技术人员的调试能力导致的过程能力低,那么即便给工艺技术人员再大的压力,工艺技术人员也无法解决,需要工艺技术人员汇报给管理者,说明是由于普通原因导致的问题,这样的情况只能是管理者去解决和决策,这就是所谓的系统的措施。如果是因为工艺调试能力不足,或者是工艺设计不合理导致的问题,或者是工装的问题,这就是需要工艺技术人员解决的,而不是管理者的责任,这就是所谓的局部措施。如果不能正确区分是谁的责任,或者是不能准确区分该采取哪种措施,就会影响问题的解决。
第一章 第E节 过程控制和过程能力
过程控制系统的目的就是对过程当前和将来的状态作出预测,以便对影响过程的措施作出经济合理的决定。这些决定需要平衡不需控制时却采取了措施(过度控制或干预)和需要控制时未采取措施(控制不足)的风险。就是说该采取措施就采取措施,不该采取措施就不采取措施。如果不该采取措施时采取了措施就是过度控制或干预,好像没事找事和多此一举;如果该采取措施时却没采取措施就是控制不足,好像该管不管和坐以待毙。“有所为和有所不为”,需要经济合理的决定。为什么可能会导致决定的错误?因为使用控制图有“虚发警报”和“漏发警报”,也就是两类错误。
过程控制系统的目的就是对过程当前和将来的状态作出预测。这句话有什么涵义?如何才能作出预测?为什么能作出预测?既然是“过程控制系统”,那么控制的涵义里当然应该包括能对过程进行预测,如果不可控或者不稳定,怎么能预测呢?!能预测就表示有规律可循,如果没有规律怎么能进行预测呢?有规律的前提是什么呢?那就是过程仅仅受普通原因的影响,过程的输出符合随机模式,所谓的正态分布。正态分布就是规律,既然有了规律就能对过程的未来状态进行预测。首先应通过探测并消除变差的特殊原因,使过程处于统计受控状态,这样其性能就可预测了,并可评定其满足顾客期望的能力。一般来说,由于统计受控的过程服从可预测的分布,从该分布便可以估计出符合规范产品的比例。只要过程保持统计受控状态并且其分布的位置、分布宽度及形状不变化,就可以继续生产相同分布的符合规范的产品。
下面图片是中国质量协会组织编写的第三版《六西格玛管理》中的内容,也是说通过过程输出结果的规律性,(就)可以探测过程是否处于控制状态。
下面图片是《质量工程师手册》的内容:
过程在统计控制下运行指的是仅存在造成变差的普通原因。这样,过程控制系统的一个作用是:当出现变差的特殊原因时提供统计信号(该作为时就有所作为),和当不存在特殊原因时避免提供错误信息(不该作为时就不作为)。
结合上图再接着对“过程控制系统”进行解释。过程控制系统顾名思义是用来控制过程或者是过程得到控制。过程得到控制就是过程处于统计上的“受控”状态。什么是统计受控状态?就是消除了过程的特殊原因,仅仅受普通原因的影响。也就是说,过程处于受控状态了(结合上图,过程得到控制,简称过程控制),也就有规律可循了,能对未来进行预测了,这样,过程控制系统的一个作用是:当出现变差的特殊原因时提供统计信号,能识别和区分过程的异常,就能及时采取措施,这就是所谓的“过程控制”。结合上图以及文章的解释,是不是更容易理解“过程控制”这个“生硬”的概念了呢。
注意:蓝色字体为参考手册的原文,用手册的原文是为了增加文章的可信度。
过程如果仅仅受普通原因的影响,在统计受控或稳定状态下运行,就有规律可循或是可以预测未来状态;既然有规律可循就能区分过程运行得是否正常。“过程控制系统”这个词可能会被感觉很“高大上”,但在提供“统计信号”的事情上,其实就是控制图的任务。
有时SPC或CPK只是被用来评估过程的能力是否满足要求,评估完后就不再继续使用,相当于只是一个一次性的评估工具。SPC的真正好处在于把它作为一个持续学习的工具,而不是仅仅当作符合性判定的工具。比如经过初始过程研究的分析和调整后,过程已经稳定运行,过程能力指数CPK也符合要求,如果不继续对过程进行监控,但是当因为变化点导致的特殊原因发生时,过程能力还是会受到影响。所以SPC的真正好处应是用于过程的监控,收集和分析过程信息,判定和预测过程当前和未来的状态,以便及时采取措施。本文为“质量管理之行”原创,首发于微信公众号“质量管理之行”。
下面这些内容是2009年的总结:
上周二去一家公司面试,被问到过程控制(SPC)中控制图和Cpk的区别,被面试的人“教育”了一番,听着面试主考官的解释,真是不敢恭维,又不好意思反驳,毕竟人家是占据有利的时局。郁闷之余,只好自己在博客中抒发一下感慨,也是把自己的所学做一下总结和提升。
任何工具和手法都是为了目的而应用,不能脱离目的为了用而用。控制图中最常用的应该就是平均值和极差图了,那就以此为例与Cpk做比较。控制图的目的是起到预警作用,在制程有特殊原因的时候发出预警,以便及时采取措施,防止不良产品的产生。控制图分两种,一种是分析用控制图,一种是控制用控制图。分析用控制图是在制程运行的初期阶段分析制程的特殊原因,找出特殊原因并采取措施,使制程变成稳定状态,当制程处于稳定状态时,计算出控制图的上下限,此时的控制图为日常用,即所谓的控制用控制图。Cpk是表示短期的过程能力指数,也代表着一定的良率,是短期现状能力的一种表现,是制程能力的评估。计算Cpk的数据要取自正态分布的样本,因为过程能力的计算的理论基础就是正态分布。Cpk的计算也可应用控制图的数据(在没有异常值的情况下)。2009年7月12日
控制与能力
讨论过程能力时,需考虑两个在一定程度上相对的概念:即过程能力(Process Capability)和过程性能(Process Performance)。
过程能力由造成变差的普通原因来确定,通常代表过程本身的最佳性能,当过程似乎在统计受控状态下运行时,过程能力可以得到证实,它与规范无关。
然而,内外部的顾客更关心过程性能,也就是过程总的输出以及与他们要求(定义为规范)的关系,而不管过程的变差。这句话有问题,请仔细认真理解和分析。因为是基础知识,涉及概念理解的准确性,所以下面要非常详细地进行“论证”,搞清楚这句话的真实意图。
为什么过程能力与规范无关?那就需要先了解一下什么是“规范”,再了解过程能力的数学或公式定义。按照ISO9000:2015中3.8.7对规范的定义,规范属于文件。虽然规范是阐明要求的文件,其实规范的本质就是“要求”,因为规范或文件就是阐明要求或承载要求。ISO9000中的术语只是通用的,涵义的范围还是比较广泛,所以还需要结合在标准或参考手册中的具体应用情况或语境,进行更加精准的理解。如果不对ISO9000术语或者是体系标准框架下的术语,亦或是ISO通用的术语很熟悉,那么学习和理解标准条款就可能会遇到困难,也可能产生偏差和误解。既然是ISO的术语,也意味着术语的涵义或意思在一定程度上是符合很多公司的习惯(比如作为最佳实践参考的公司)。
接下来再看看第二版《统计过程控制SPC参考手册》的附录G对“规范”的解释。请参见下图。
从第二版《统计过程控制SPC参考手册》的附录G对“规范”的解释可以知道:在SPC参考手册中的“规范”是一个工程要求,用来判定特定的特性是否可以接受,说白了就是产品规格或产品规范。比如对一个产品的特性进行CPK计算时,可能会有双边公差或单边公差,也可以说是双边规范或单边规范。ISO9000术语3.8.7规范的示例中以及注解1中说,规范可以是技术图纸、产品规范、性能规范等。了解了SPC参考手册中“规范”的意思,还需要再了解“过程能力”的定义或解释。
第二版《统计过程控制SPC参考手册》的附录G对过程能力的解释如下。
在这里要特别注意一下,对于计数型数据,过程能力通常被定义为不合格品或不合格的平均比例或比率,所以用不合格率也是可以表示过程能力的,例如在IATF16949:2016版标准的9.1.1.1制造过程的监视和测量中就说用“批次对规范的符合性”可以当作过程能力的替代方法。
第四章第A节对过程能力的说明如下:
在高等教育出版社第二版《新编质量管理学》中这样描述过程能力:
顺便再看看第一版SPC参考手册是在怎么说的,请参见下面图片:
按照附录G和第四章第A节内容的说明,再对比第一版SPC参考手册的内容,可以确定过程能力就是过程固有变差的6σ(估计值)范围,计算方式为6乘以σ,它的数值越小越好;或者说计算和统计完固有变差σ的估计值之后,再乘以6就是过程能力。从过程能力的说明以及公式来看,和产品的规范或规格没有关系,所以在第一章第E节对过程能力进行解释时说:过程能力与规范无关。过程能力与规范无关,这句话表达得太简单了,相比较而言,第一版的内容表达和描述得更详细,也更好理解。这里再顺便想一想,CP和CPK的计算公式是不是和产品的规格公差有关,而过程能力和公差没有关系!所以,按照SPC参考手册的定义或说明,或者是严谨地说,“过程能力”和“过程能力指数”是不同的意思,也是不同的公式,这这里先提前说一下,后面再详细解释。
再看看SPC参考手册对过程性能的说明和定义。
第二版《统计过程控制SPC参考手册》的附录G对过程性能的解释如下:
第四章第A节对过程性能的说明如下:
内外部的顾客更关心过程性能,也就是过程总的输出以及与他们要求(定义为规范)的关系,而不管过程的变差。这句话又怎么理解和解释呢?按照“过程性能”定义和计算方式,过程性能是过程总变差估计值的六倍范围,和变差有关系,反而和“规范”没有关系。为什么不管过程的变差呢?反而和规范有关系了呢?是过程性能不(用)管过程的变差?还是顾客不管过程的变差?这句话和过程性能的定义及计算公式是不是有矛盾了?
本文为“质量管理之行”原创,首发于微信公众号“质量管理之行”。
将ProcessPerformance翻译为“过程性能”是否合适?按照汉语习惯好像不太好理解。其实中国质量界一直存在不同意见或说法,而且中国的质量管理的前辈们也坚定和坚持了自己的看法和观点,在高等教育出版社出版的第二版《新编质量管理学》中,将过程能力分为了短期过程能力和长期过程能力。长期过程能力对应的是过程的总变差,相当于SPC手册中的“过程性能”。将Process Performance翻译为“过程实绩”,也可以理解过程绩效。过程实绩和过程性能,哪一个更符合中国的语言习惯呢?!当然是过程实绩或过程绩效更合适啊!在SPC参考书手册中,CPK 和Ppk分别翻译为能力指数和性能指数,而中国的高等教育出版社的第二版《新编质量管理学》以及中国质量协会组织编写的第三版《六西格玛管理》则将CPK 和Ppk分别翻译为能力指数和绩效指数(或实绩指数),并且将CPK定义为短期过程能力指数,将Ppk定义为长期过程能力指数。
通过对比中国质量管理领域相对比较权威的相关的资料可以知道,将Process Performance翻译为过程性能其实是有些不合适的。但是如果将ProcessPerformance按照过程绩效或过程实绩理解,还是和第二版SPC参考手册的这段内容对应不上,而且还感觉第二版SPC参考手册的这段话的内容有些别扭或者是有些矛盾,尤其是按照ProcessPerformance定义的公式来说,更是和刚才的这段内容有矛盾。难道是除了翻译的问题外,第二版SPC参考手册的这段内容也有问题?虽然Process Performance有公式定义,难道在这段话中,此“过程性能”不是公式中定义的那个6倍过程总变差的“过程性能”?即此“过程性能”不是彼“过程性能”。
再重复一下感觉有问题的这段话:内外部的顾客更关心过程性能,也就是过程总的输出以及与他们要求(定义为规范)的关系,而不管过程的变差。
既然仅仅从文字内容的表面看,这段话的确是矛盾的,那就再来增加点证据,也从不同的角度去分析,即从这段话的意图去分析是否有问题。看看第一版SPC参考手册的内容,和第二版的内容对比一下。
下面是第一版SPC参考手册的内容,为了更稳妥和严谨,中文和英文一起查看。
下面是第二版SPC参考手册的内容,也是中文和英文一起查看:
从第一版和第二版SPC参考手册内容对比发现,第一版的这段话中在讨论“过程能力”时没有出现“过程性能”这个词,第一版和第二版的内容是有明显的差异,所以表达的意思完全不同了(但是意图其实是一样的),第一版的说是“内外部顾客更关心过程的输出与规范的关系如何”,相当于顾客只关心输出的产品是否满足规范。对比第一版SPC参考手册,再结合《新编质量管理学》和《六西格玛管理》等资料,通俗点表达和总结一下这句话的意思是:内外部顾客更关心产品是否能满足产品规格的要求,而不关注过程的变差如何。也就是顾客比较关注过程的实际绩效,或关注“过程实绩”。如果将过程性能理解为过程绩效,且别把这个Process Performance对应到六倍西格玛那个“过程性能”的定义,只是广义地理解为过程绩效即可。
在实际工作中,有的供应商的不合格产品因为时常流到顾客端,让顾客很生气,所以顾客有时可能会说:不管你们内部怎么乱,工艺有多差劲,只要别将不合格流出来就行。过程能力低是容易产生不合格品,但是认真检验或检查,就能防止不合格品的流出。过程的输出是什么?过程的输出是产品,顾客关心产品?关心产品什么啊?关心产品是否合格!关心产品和产品规范或产品规格的关系,就是关心产品合格与否,而不考虑过程的变差是受什么原因影响。产品的波动是随机也好,是非随机也好,不管是统计受控状态,还是受特殊原因影响,顾客都不太关注,只是关注发到顾客端的产品是否合格,这就是顾客所需要的过程的实际绩效或“过程实绩”。所以第二版SPC参考手册第四章第B节中的内容中这样说到:“性能指数Ppk表示过程性能是否实际上满足了用户的需求”。请参见下面的图片,是第二版《新编质量管理学》对Pp和Ppk的说明。从这里可以知道,Pp和Ppk的计算不需要稳态,也就是过程即便有特殊原因影响也可以计算Pp和Ppk,因为Pp和Ppk主要是想反映当前的实际状态,也就是不管过程受什么原因影响,主要是想表达过程实际的绩效到底怎么样。
备注:虽然“过程性能”翻译得不合适,但为了和第二版SPC参考手册的内容相一致,也是为了对照,在下面的文章中,有时还会使用“过程性能”,但也会根据语境使用“过程绩效”或 “过程实绩”,亦或是表达为“过程的实际绩效”。不管是“过程性能”还是“过程绩效”,只是翻译的差异,它们都是对应统一个词Process Performance。
短期过程能力(指数)和长期过程能力(指数)的区别
在工作中发现,有的人容易把短期过程能力和长期过程能力混淆或弄反,也不清楚两种指数的应用条件是什么,那咱们接下来就顺便地也更详细地说一说CPK和Ppk的区别。
第二版《新编质量管理学》中这样描述偶因和异因:“从对质量的影响大小来看,质量因素可以分为偶然因素(简称偶因)与异常因素(简称异因)两类。偶因是始终存在的,对质量的影响微小,但难以除去。异因则有时存在,对质量影响很大,但不难除去,例如车刀磨损、固定机床的螺母松动等。偶因引起质量的偶然波动(简称偶波),异因引起质量的异常波动(简称异波),偶波和异波都是产品质量的波动。”从上面的描述中可以知道,“偶因”相当于普通原因,“异因”相当于特殊原因。
短期过程能力是指仅有普通原因或“偶因”所引起的变异形成的过程能力,对应的短期过程能力指数为CP和CPK。长期过程能力是指由偶因和异因之和引起的总差异,它实际上反映了长期变异,也称“实绩变异”。所以按照中国目前比较权威的资料和说法,Process Performance翻译为“过程绩效”或“过程实绩”更合适,它表示的是长期过程能力,对应的长期过程能力指数或性能指数就是Pp和Ppk。既然第二版SPC参考手册对过程性能Process Performance的定义是过程的总变差,当然就包括了所有原因引起的变差,不管是特殊原因还是普通原因。什么是总?就是包括所有原因引起的变差。从公式计算上来讲,既包括了组内变差也包括可组间变差,这是计算上的“总”。本文为“质量管理之行”原创,首发于微信公众号“质量管理之行”。
下面图片是第二版《新编质量管理学》中的内容。
下面图片是《六西格玛管理》的内容:
下图是《六西格玛管理统计指南》中关于短期和长期过程能力的内容,相信对质量管理或统计技术有所研究的人对这本书应该也很熟悉,相比较而言,这本书也算比较权威了。在这本书中,也将称为了Ppk长期能力指数。
在这里再重复一遍第四版《生产件批准程序PPAP参考手册》之“2.2.11.2质量指数”的内容:“对于带有已知的和可预测的特殊原因且输出满足规范的过程,应使用Ppk”。过程处于稳态或统计控制状态,才能计算短期过程能力指数CPK,如果过程受特殊原因影响,那就按照长期过程能力Ppk计算。真正地知道了CPK和Ppk的含义和区别,在后面学习第二版SPC参考手册第四章“认识计量型数据的过程能力和过程性能”的内容就会很容易了。说了这么多,本篇文章中前后也列举了很多权威资料,而且这些资料的说法都是一致的,这回大家对CPK和Ppk的区别应该很清楚了吧,也应该非常坚定了吧!
既然在稳定状态下计算CPK才有意义,怎么知道过程是否处于稳定或受控状态啊?既然是过程有特殊原因时使用Ppk,那么怎么知道过程有没有特殊原因呢?很简单啊,用控制图分析啊,再简单的是用“正态概率图”。如在《统计过程控制SPC 第1部分》(可以点击链接查看文章)中所说的那样:说SPC没有作用的公司,那是没有真正了解SPC,因为不能随便把SPC和CPK分开,因为很多公司虽然认为SPC没用,但没说CPK没用,要知道,它们是一个“系统”。正如在《质量工程师手册》中所说:“对于尚未推行SPC与SPD的企业来说,本来是没有条件去计算过程能力指数的”。如果使用minitab软件,可以使用“六合一”计算,直接运行出控制图,正态概率图,直方图等(详情可以阅读《六西格玛管理统计指南》)。
下图是《质量工程师》的相关内容:
C****PK****和Ppk哪个更大?
既然长期过程能力或过程绩效还包括了普通原因或随机因素之外的特殊原因,受到了更多种类因素的影响,所以对于同一个过程来说,如果过程受到了特殊原因的影响,相比较而言,,一般情况下是长期标准差较大,而短期标准差较小,相应的短期过程能力指数CPK也就更大,而长期过程能力指数Ppk更小。如果过程没有受到特殊原因的影响,CPK和Ppk不管谁大谁小,它们的大小应该没有明显的差异。以上说的是一般情况,如果特殊原因对过程是有利的,也有可能让产品的变差更小,这样的情况就可能出现Ppk大于CPK。不管怎么说,过程受到特殊原因影响时,CPK和Ppk的大小一般会产生明显的差异。
下面的图片是第二版《新编质量管理学》的内容:
下面图片是《六西格玛管理》的内容:
下面图片是《六西格玛管理统计指南》的内容:
过程能力指数计算的取样周期
既然C<sub>PK</sub>为短期过程能力指数,那么这个短期的标准是什么?是一天?还是一小时?或者是一周?其实所谓短期想表达的主要意思是不受特殊原因影响,因为时间越短,过程发生变化的机会就越小,受特殊原因影响的几率也更少,在这期间内过程输出的产品的差异也会很小。既然C<sub>PK</sub>为短期过程能力指数,需要在过程只受普通原因影响的稳定状态下或统计受控状态下取样并进行计算,如果取样的产品间隔周期过长,是不是过程就有可能容易受到特殊原因的影响?比如在工装或机器的磨损等特殊原因影响下,一般在短时间内生产的产品的差异不大,但是如果时间相对更长,工装不同磨损程度下生产的产品就可能产生统计上的明显差异。用《六西格玛管理》中的内容说就是:“很多波动源在短期观察中可能不会出现或很少出现,而长期收集到的数据则会包含它们。”(请参见下图)
短期过程能力指数CPK的数据需要在过程稳定时或只受普通原因影响时取样,以确保能得到过程的固有能力,更是为了不会低估过程能力;长期过程能力指数或过程绩效指数Ppk的取样数据则需要包括特殊原因,以确保不过高估计过程的真实绩效。如果过程受到了特殊原因的影响,但是Ppk的取样数据中未受到特殊原因影响,那么Ppk会比真实值高,也就是会“高估”过程绩效。
如何使过程得到控制?
首先应通过探测并消除变差的特殊原因,使过程处于统计受控状态,这样其性能就可预测了,并可评定其满足顾客期望的能力。这是持续改进的基础。
如何探测并消除变差的特殊原因?这就是初始过程研究的时候要完成的工作。所以控制图分为“分析用控制图”和“控制用控制图”。过程分析阶段需要识别和消除特殊原因引起的变差,然后再计算控制图的中心线和上下控制限,然后才能用于后续“控制阶段”的过程的日常监视和控制。过程处于统计受控状态,也就有了规律可循,因为它的分布规律是可预测的,所以过程绩效就可以预测了。因为服从统计规律的分布能估计出符合产品规格的比例,所以就可以评定该过程满足其顾客期望的能力。
消除了过程的特殊原因,使过程处于统计受控状态只是持续改进的基础,接下来还需要继续提高过程能力,所以一旦过程处于统计受控,对过程采取的第一措施就是将过程位置固定在其目标值上,也就是调整过程的均值的位置与产品规格的目标值位置一致。
如果过程分布的宽度过大,就会超出产品规范的虚线边界。分布宽度也可以说是产品的分散程度或一致性程度,可以用σ(西格玛)量化表示。分布宽度过大就会使分布显得更 “胖”。
从上面图片可以看出,随着时间的变化,过程分布的图形从很“胖”到越来越“苗条”,并且从一开始的超出虚线到了虚线之内。在前面的内容中已经说过,特殊原因需采取局部措施,普通原因需对系统采取措施。如果过程处于统计受控状态,但是过程的分布宽度是不可接受的,即过程分布超出了产品规格的虚线之外(即产品不合格),这就是下面将要提到2类过程,那就赶紧对系统采取措施以减少普通原因引起的变差来改进过程的能力,在过程能力得到改进之前最好是尽量生产最小数量的产品,以降低不合格品数量。
过程的分类
每个过程都可以根据其能力和是否受控进行分类,过程可分为4类,如下表所示:
为了好理解,对比一下《质量工程师手册》的相关内容,下面图片是《质量工程师手册》内容:
“能力可接受”或“技术处于稳态”就是有能力满足产品的公差,如果产品不合格就是能力不可接受。其实“能力”或“技术稳态”是否可以接受就是指产品能否满足产品规格的要求。有时虽然过程处于统计受控状态,但是“过程能力”较低,没有“能力”满足产品公差,过程分布很容易就超出了产品规格,即产品不满足规范要求,这就是技术状态不可接受。通俗且简单点说,如果过程处于受控状态,但是产品容易不合格,满足规范的能力不足,即能力不可接受,这就是SPC参考手册中所说的2类过程,这样的过程因为是普通原因影响,所以要对系统采取措施。
过程统计受控且有能力满足公差的要求,也就是过程处于统计受控且产品符合规范或规格,这样的过程才是理想的过程,也就是SPC参考手册中所说的1类的过程。
即不统计受控,产品合格的能力又不可接受,这就是4类过程,必须减少变差的特殊原因和普通原因。
3类过程(是产品)符合要求可以接受,但不是统计受控的过程,需要识别变差的特殊原因并消除它。有些情况下,顾客也许允许制造商(或供应商)运行3类过程,这些情况包括:
●顾客对规范要求之内的变差不敏感(见第四章讨论的损失函数),只要产品满足规范要求或公差要求就可以。
●对特殊原因采取措施所发生的成本比任何所有顾客得到的利益大,因经济上的考虑,可允许存在的特殊原因包括刀具磨损、刀具重磨、周期的(季节的)变化等。综合考虑成本和质量风险,要想消除这些特殊原因需要很大的经济成本,或者是在一定程度上是无法消除的,比如工装和设备磨损等。如果不消除类似这样的变差,但是也能有效控制产品质量。
●特殊原因已被识别,其记录表明具有一致性和可预见性。因为具有一致性且影响程度不会随便变化,这样的特殊原因对产品的影响是可预见的,也是可控的。
有些情况下,顾客可能会有以下要求:
●过程是成熟的。比如是非常成熟的工艺和技术,有相当的经验积累,也有良好的业绩表现。
●允许存在的特殊原因在已知一段时间内表现一致。相当于上面提到的“特殊原因已被识别,其记录表明具有一致性和可预见性。”得让顾客相信特殊原因在已知的一段时间内的确没有发生变化,对产品的影响是一致的。本文为“质量管理之行”原创,首发于微信公众号“质量管理之行”。
●过程控制计划有效运行,可确保所有的过程输出符合规范并能防止出现别的特殊原因或允许存在的特殊原因表现不一致。这句话翻译得很生硬,一句话太长不容易理解,分成几部分可能更容易理解。如果按照控制计划运行能确保所有的过程输出符合规范,产品都是合格的,也能防止出现别的特殊原因,防止允许存在的特殊原因表现不一致,也就是被顾客允许的特殊原因不会随便发生变化,对产品的影响是一致的,也就是可预测和可控的。
怎么才能证明上面内容提到的特殊原因的一致性?怎么提供证据证明特殊原因的可预见性?当然是控制图啊!要想知道特殊原因对产品的影响,第一步是从统计上识别特殊原因,然后才能分析其对产品的影响。除了使用控制图外,重点还需要考虑抽样方法,如果抽样方法不合理,抽样无法覆盖或包含特殊原因,那就无法当做“有效”证据了。
过程指数
如前文提到的,过程能力和过程指数是不同的。不仅仅是名称不同,因为它们的计算公式也是不同的,比如过程指数CP等于过程能力除以产品公差范围。请参见下面的图片(第四章第A节的内容)。
为什么这个章节称为过程指数而没有称为过程能力指数呢?因为过程指数分为两类,一些是使用子组内变差估计进行计算,另一些是当估计给定的指数时使用总变差估计(参见第四章),相对应的分别为(过程)能力指数(CP和CPK)和(过程)性能指数(Pp和Ppk)。建立不同的指数是因为:1)没有一种指数可以广泛地应用到所有过程中,和2)没有一个过程可以由一种指数完全描述。例如:推荐同时使用CP和CPK(间第四章),并且图表技术一起使用,可以更好地理解估计的分布和规范界限的关系。如果只是计算出一些过程指数,它们仅仅是一些数值,不能细节地体现过程的分布和位置,不利于了解过程的实际情况的,因为所有的指数都有不足之处且有可能产生误导,任何从计算的指数中得到的推断,都应该由对计算这些指数所用的数据的适当解释来驱动。这些通过统计公式计算的指数不能完全准确地出模拟过程的实际规律,不仅在客观上可能有误差,还可能产生对使用人员的主观上的误导。比如有的人“偏执”地相信统计数据或指数,而忽略了统计公式的“误差”或“不完美”。(有的)汽车公司已经设定了对过程能力的要求。读者有责任与他们的顾客联系从而确定使用哪些指数。在有些情况下,可能最好是什么指数都不用。
过程能力指数不等于也不包括过程性能指数。如果按照ISO或国际上的表达习惯,在正式场合或严谨地说,需要将过程能力和过程性能分开说,因为它们有差异,如果是在一般场合,尤其是用文字表达的时候,可能习惯地笼统地说成“过程能力指数”,而用字母简写表示的时候,直接就区分了,因为过程能力指数(CP和CPK)和过程性能指数(Pp和Ppk)的简写不同。过程能力指数是“总结”、评估、衡量过程能力的,是过程能力的表现(这里的过程能力是宏观表示,不是公式意义上的过程能力),所以在文字或语言表达上,不会刻意去区分,一般会习惯说“过程能力”。如果按照中国质量教材的翻译和理解,因为引入和区分了短期过程能力和长期过程能力,所以可以用过程能力指数同时表示(CP和CPK,Pp和Ppk)。在这里强调和区分一下,是为了对后面的内容更加“敏感”,以便对其含义有更加准确的理解。但在使用和阅读英文的相关手册或标准时,一定要注意区分过程能力(Process Capability)和过程性能(Process Performance)。
过程能力指数CPK使用过程的固有变差来计算,相当于过程的“固有”能力,还可以形容为过程“理论”(上)的能力,而过程性能指数Ppk相当于是过程的实际能力。尤其像工装慢慢磨损的情况,从短期看,过程是受控的,从相对的长期看,过程就可能发生明显变化,如果抽样时间间隔相对较长,用控制图分析时,也可能会提示特殊原因。举个不恰当的例子用来进行类比,比如一个运动员的在日常训练中,在正常的状态下会有一个“固有”能力,如果在比赛时,没有其他特别的因素干扰,比赛成绩会围绕着日常训练的固有能力随机波动,如果比赛前没休息好,或者是对场地不适应,或者是对气候不适应,或者比赛过程中受到其他运动员干扰了,那么这个运动员可能就无法发挥出日常训练的固有能力,所以也就是说固有能力是正常状态下的理想能力,但是在实际中可能无法发挥出理论上的理想能力,这个实际发挥出的能力就是Ppk。为了好理解,可以联想和类比一下产能,就像形容产能一样,理论产能一般可能达不到,因为可能有各种因素干扰导致实际产能低于理论产能。如果再延伸一点,当然也有可能受到有利的特殊原因影响,达到超常发挥的效果。
过程指数的作用或应用
在汽车行业中可接受的做法是在一个过程被证明处于统计受控状态下才计算其(Process Capability)过程能力(普通原因变差),这些结果被用作预测过程如何进行的基础,根据从不稳定或不可重复的过程得到的数据进行预测是没有什么价值的。特殊原因是造成分布的形状、分布宽度或位置改变的原因,因此很快会使关于过程的预测失效。就是说,为了将各种过程指数和比率用作预测工具,要求用于计算它们的数据是从处于统计受控状态的过程收集的****。
从上面这段话中,我们知道了过程指数的作用,那就是可以用作预测工具。那预测又有什么作用?用第四章第B节的内容说就是:“能力指数CPK还可用来确定一个过程是否有能力满足顾客的需要,这是能力指数的最初始的用途。性能指数Ppk表示过程性能是否实际上满足了用户的需求。”过程指数本来就是统计已发生的或现在的情况,用过去的或现在的情况估计或预测未来的状态,也可以说用现在的“能力”去预测未来的“能力”。
先说说过程指数为什么可以是一个预测工具。预测什么?预测过程未来状态及能力。怎么描述过程能力?那就是过程指数,当然也可以用合格率或不合格率来描述“过程能力”(需广义和通俗理解的)。按照第一章第E节的内容可以用一句话表达:“一般来说,由于统计受控的过程服从可预测的分布,从该分布便可以估计出符合规范产品的比例”。只要过程保持统计受控状态并且其分布的位置、分布宽度及形状不变化,就可以继续生产相同分布的符合规范的产品。简单和概括地说就是:通过过程指数的计算,可以预测或估计产品的合格率,即可以估计出符合规范产品的比例。比如在无偏情况下,产品规格公差内包含六个西格玛宽度的范围,那就意味着有99.73%的产品是合格的。
《质量工程师手册》的相关内容如下:
在第二版《新编质量管理学》的135页中这样描述CP和CPK的应用价值(黑色加粗字体):“C****P****和C****PK****对于决策者有很多参考价值,需要认真研究考虑。下面是一些应用的例子,仅供参考:
1****)由于C****P****和C****PK****是无量纲的,故通过C****P****和C****PK****可以了解各个供应商的质量水平,也可以通过其对本企业各个生产单位的质量进行评价比较。
2****)若销售人员了解本企业过程的C****P****和C****PK****,当发现某顾客要求的规范较为宽松时,则产品的合格率一定会大幅提高,利润也会更有余裕,即使降价求售也仍然能够有所盈余,这时就可以考虑最优的销售策略。
3****)若生产人员能够掌握本企业过程的C****P****和C****PK****,就可以预计产品的合格率,从而调整发料与交货期,以便用更经济的成本去满足顾客的需求。”
从上面的描述中可以知道,可以用来:1)内外部质量水平的评价和对比;2)根据其表示的质量水平,评估销售方面的竞争力并调整销售策略;3)预估产品的合格率以更好地安排生产计划。
在实际工作中,成本、效率和质量等是辩证一体的,是一个事情的不同维度和不同要求。比如在用于销售报价的成本评估时,肯定要考虑产品的合格率,这都是工作中的常识。比如在设计评审时,要考虑顾客的公差要求是否能达到。怎么评估是否能达到顾客的公差要求?除了凭着经验直接判断外,那就是根据以往的类似产品的过程能力去预测合格率或满足公差的能力。记住有很多能力指数的公式中包含了产品规范(比如产品公差),这一点很重要。如果规范不合适,或不是基于顾客的要求,努力使过程来符合这些规范,将浪费大量时间和精力。
第一章 第F节 过程改进循环及过程控制
在对过程应用持续改进这一概念时,可以使用三阶段的循环(见图1.4),每一个过程都会处于改进循环这三个阶段中的某个阶段。从图中还可以看出,除了三个阶段构成了一个改进循环,其中的每一个阶段也都应用了PDCA的循环。
1****、分析过程
要想改进过程,就需要先了解过程,所以当考虑对过程进行改进时,要先对过程进行分析,以便对过程有较好的了解。
需要了解过程的什么内容?其实还是“过程方法”的思路,即过程的目的是什么?期望得到什么?如何达到过程的目的?即过程的步骤是什么?过程的输出是什么?输出是否满足期望?如何评价输出是否满足期望?
过程的产品变差如何?哪些因素会影响产品或过程的输出?哪些因素对产品影响较大?过程可能会出现什么问题?有哪些风险?过程是否处于统计受控状态?过程能力是否满足要求?
很多在《APQP》手册中讨论的技术,可以用于较好地理解过程,这些活动包括:
●小组会议
●评审过程的历史
●进行失效模式及后果分析(FMEA)
●与开发或运作该过程的人员(“主题事务专家”)商讨,用第一章第G节的备注11的话说就是:“即使采用了所有可能的方法,有些风险依然存在,实际上对将来措施的预测信心并不可以仅由统计方法决定,也需要对于主题事务的专业知识。”统计是有“误差”的,也会引起误判,用第一章第E节的内容说是:所有的指数都有不足之处且有可能产生误导,所以要结合专业知识和实际经验才能更好地应用好SPC。比如控制图仅仅是统计信息或统计信号,分析和理解以及决策需要相关人员的经验和知识。请参考下图(第二版《质量管理学》)的内容:
本手册所述的控制图也是应该在过程改进循环中使用的有力工具。这些简单的统计方法用来帮助大家区分变差的普通原因和特殊原因。变差的特殊原因必须被提出。当达到了统计控制状态后,便可以评定过程长期能力的当前水平(见第四章)。本文为“质量管理之行”原创,首发于微信公众号“质量管理之行”。
2****、维护(控制)过程
一旦对过程有了较好地理解,就必须使过程维持在一定的能力水准上。过程是动态的并且会变化,所以必须(要)监控过程的性能,因此要采取有效的措施来防止过程发生不希望的变化,同时必须了解所希望的变化并使之保持稳定。本手册介绍的简单的统计方法在这方面可以有帮助,制作及使用控制图或其他工具,可以对过程进行有效的监控。从这里可以知道,控制图是用来监控过程的,当过程发生变化时,可以通过控制图进行探测和预警。探测到过程的变化及异常,只是改进的前提,重点是实施第三阶段的改进。
3****、改进过程
使过程稳定并持续维持过程的稳定状态,不代表过程能力已经达到了理想状态,要知道,改进是无止境的。对于有些过程,顾客甚至会对工程规范内的变差表示敏感(见第四章),比如有时产品只有满足规范的目标值要求,才能满足顾客需求,如果产品偏离了目标值,虽然还是在公差范围内,都会对顾客产生影响,在这种情况下,持续改进的价值只有在变差减小后才能实现。为此需要额外的过程分析工具,包括更先进的统计方法,例如:实验设计及先进的控制图等。
如何改进过程?当然是改变过程的要素及其相互作用。如果不改变过程,或者过程是一成不变的,过程能力会提高吗?所以要有目的地向过程中引入变化并测量其效果。当对过程进行调整或改进后,或新的过程参数确定后,意味着过程已经发生了变化,还需要重新分析过程,确定过程是否处于稳定状态。在实际工作中,过程发生改变时的很多情况需要重新提交PPAP,PPAP中一般会有CPK,计算CPK是不是需要在过程稳定时取样?!
提高质量的同时也要考虑成本,因为减少普通原因的意图就是改进质量使之处于更低的成本。如果在质量风险已经可控的前提下不计成本地提高质量,那么会顾此失彼。顾客不可能接受不正常的高价,企业也不可能赔钱销售产品。如果质量风险可控,继续提升质量需要花费更高的成本,别说减少普通原因,就连减少特殊原因都要视情况而定,就像第一章第E节中提到的:对特殊原因采取措施所发生的成本比任何所有顾客得到的利益大,因经济上的考虑,可允许存在的特殊原因包括刀具磨损、刀具重磨、周期的(季节的)变化等。
第一章 第G节 控制图:过程控制和改进的工具
两类错误
W.E.戴明博士在他的书里指明了在过程控制方面经常犯的错误:
错误1:将事实上属于系统(普通原因)的变差,描述成特殊原因的变差或错误。
错误2:将事实上属于特殊原因的变差或错误,描述成系统(普通原因)造成的。
第1类错误通俗点说就是,过程实际上没有特殊原因影响,但是控制图却显示或判定有特殊原因。比如按照控制图的“判异原则”(判断异常的原则),点出界就判异,但是理论上在±3σ范围内只包含99.73%概率,有0.27%是应该在±3σ之外的。也就是说大约有千分之三的概率超出±3σ界限是正常的,即便没有特殊原因影响,也会有大约千分之三的概率超出±3σ界限,但是如果按照“点出界就判异”的原则,有时即便没有特殊原因,也会判定成有异常原因,这就是“虚发警报”,发生这种错误的概率通常记以α。简单说就是:没问题却判定成问题。狼实际没来,但是却喊狼来了,这就是“虚发警报”。
第2类错误通俗点说就是,过程发生了特殊原因或异常,但是控制图却没有显示出来,或者是从统计上不明显。因为有时即便生产异常,但是有一部分产品还是在控制限之内,按照“判稳原则”也可能是正常的。有问题却没识别出来,这就是“漏发警报”,发生这种错误的概率通常记作β。简单地说就是:狼来了,却没有发现,没有喊狼来了,这就是“漏发警报”。从下图可以看出,过程的分布明显偏离了控制中心线,按照统计规律,产品有很大的概率会超出控制上下限甚至可能超出产品公差规格,但是仍有一部分产品处于上下控制限之内(如图中斜线部分),如果抽样到斜线区域的产品,并在控制图中描点,由于点子未超出控制限,且有可能也不显示非随机模式,那么就无法识别出特殊原因或异常。
为将上述错误降低到零是不可能的,休哈特博士意识到了这一点,并建立了一个图示的方法通过长久运行,将两类错误的经济损失最小化。什么图示啊?当然是控制图啊!因为只有尽量准确地识别特殊原因才能减少误判,才能减少两类错误。控制图是监视过程,需要长久运行,用第一章第E节中的内容说就是:“过程控制系统可以作为一个一次性的评估工具,但是过程系统的真正的好处只有在把它作为一个持续学习的工具而不是符合性判断的工具使用才能实现。”
学习和了解了两类错误的概念,对学习和理解“假设检验”是非常有帮助。统计上的概率就是一定意义上的假设,而且都是基于某些条件的假设。条件成立时会怎么样,条件不成立时又会如何,有了条件及其预想的或假设的结果,就能根据统计的结果判断假设是否成立。就像搞研究一样,先提出假设,再进行实验和求证,根据实验结果验证假设是否成立。也像在实际工作中分析不合格原因一样,先根据现象推测或假设不合格原因,然后进行不合格再现,如果能再现相同的不合格,那就证明原因分析是正确的。假设检验其实和这些日常工作都是相似的逻辑,没有那么高深难懂,先把概念和逻辑搞清楚就容易理解了。用《新编质量管理学》中的内容来说就是:“在控制图上描点实质上就是进行统计假设检验”。(请参见下面的图片)
如何探测和识别特殊原因
为了在生产中有效地管理变差,必须有一个探测特殊原因的有效方法。有一种常见的误解就是直方图可以做此用途。直方图用图形表示了过程变差的分布,研究分布形式以确认过程变差是对称的、单峰的,并符合正态分布。不幸的是,正态并不保证过程没有特殊原因在其作用,也就是说,某些特殊原因可能在不改变其对称性和单峰性的情况下改变过程。同样一个非正态分布也可能没有特殊原因,但是它的分布是非对称的,因为正态分布仅仅是分布种类之一,仅仅是统计规律之一而已,不同的原因会用不同的方式影响过程,影响的结果会服从不同的规律。
下面图片是第二版《新编质量管理学》的内容:
形成直方图的数据相当于是混合后按照一定的区间进行分组,所以其图形不能显示产品随时间变化的情况,但是按照控制图的“判稳原则”和“判异原则”,很多原则都是和时间顺序或时间变化有关的,所以直方图虽然有时能从整体上形成正态分布,但不一定能识别出所有特殊原因。
下面图片是《新编质量管理学》中的部分“判稳”和“判异”原则,从下面图片中的内容可以知道,很多特殊原因的探测原则都和时间顺序或时间变化有关的,但直方图不能体现变差的时间变化。
基于时间的统计和概率方法的确提供了必要且足够的方法判定是否有特殊原因存在。任何时候使用均值、极差或直方图汇总数据时,如果该数据是基于时间做展示的话,汇总应该不能误导用户采取任何使用者不愿采取的措施。尽管在这个任务中有几类有用的方法但是最为通用和稳健的方法却是沃尔特·休哈特博士建立和实施的控制图类型。贝尔实验室的沃尔特·休哈特博士在二十世纪二十年代研究过程时,首先区分了可控的和不可控的变差,就是由于我们所说的普通原因和特殊原因产生的。他发明了一个简单有力的工具来区分它们---控制图。从那时起,成功地把控制图应用于各种过程控制和改进的场合。经验表明当出现变差的特殊原因时,控制图能有效地引起人们的注意,并能反映必须通过系统或过程改进才能减少普通原因变差的程度。
如果过程控制活动(识别和减少特殊原因的活动)确保没有来源于特殊原因的变差,过程可以被称为处于统计控制或“受控”,这种过程可以称为稳定的、可预测的和一致的,因为可以预测过程的表现。(而)存在特殊原因会使过程失去统计控制或“失控”,这种不稳定的过程的表现(通常)是不可以预测的。
它们****(控制图)如何工作?
控制限
休哈特博士建立控制图时,已经关注到控制图的经济性,即,只有出现特殊原因时,才采取措施。为此,可将样本的统计量与控制限做比较。
经济性还体现在哪些地方?比如,可以用什么方法判定过程的位置是否发生改变?一种可能是看过程的每一个零件,但是那通常是不经济的,替代的方法是使用过程样本,并计算样本的均值。另外,选择±3的标准差限作为经济性地控制过程的界限,也是考虑了经济性。
下面图片是第二版《新编质量管理学》的内容:
建立控制图的方法
如果有证据存在变差的特殊原因,应对过程进行研究从而进一步确定影响它的什么。在采取措施(见第一章,第D节)后,再进一步收集数据,如有必要重新计算控制限,若还出现任何另外的特殊原因,则继续采取措施。这就相当于“分析用控制图”
当所有的特殊原因被消除后,过程在统计受控状态下运行,可继续使用控制图作为监控工具,也可以计算过程能力。SPC参考手册的内容说得太生硬,好像不太好理解,那就看看咱们中国的教材吧!下面图片是第二版《新编质量管理学》的内容:
控制
通常发现,尽管在过程初始设置期间已经对准了目标值,但实际的过程位置(μ)或过程均值可能与该(目标)值不一致。对于那些实际位置偏离目标值并且能很经济地使过程复位的过程应考虑重新调整以便使其与目标值一致。以上调整是假设该调整不会影响过程的变差。但情况可能不总是这样,我们应了解在重新调整过程位置后引起过程变差增加的原因,并依据顾客满意和经济性两方面评估它。如果调整过程位置时可能会导致过程能力降低,那么这样的情况需要谨慎一些。就像实际工作中的有些情况,为了解决某些问题需要调机,但是调机后产品反而不稳定了,像这样的问题,如果不影响顾客满意以及质量成本也可接受,还不如不去调整。
我们应不断地对过程的长期性能进行分析,这可以通过对现行的控制图进行周期、系统的评审来完成。这可能会显示出特殊原因的新证据,经了解可能发现,一些特殊原因是有利的并对过程改进是有用的,其他的一些则是有害的,需要被纠正或消除。主动的对过程调整一般是朝着有利的方向进行,无意的过程改变也可能会对过程带来有利的影响。特殊原因只是统计上的区分和识别,所以特殊原因不一定都是有害的,也可能是有利的。
改进循环的目的是理解过程及其变差,以提高它的性能。随着这种理解越来越成熟,对产品变量的持续监控的需求会变得越来越少---特别是对文件化的分析显示变差的主要来源已经被有效地由其他方法控制住的过程。例如,一个过程的维护活动是变差的主要来源,那过程最好由预防性和预知性维护维持;如过程设置(setup)是绝大部分变差的来源,过程最好由设置(setup)控制图控制。
SPC是一个分析及改进过程的工具,最终的目的是为了过程的改进。如果对过程已经有足够的理解,已经积累了足够的经验,清晰地知道对产品质量有影响的所有因素及其影响机理和程度,并且已经有了充分的把握能对过程进行有效地管控,这时会减少对产品变量的持续监控。为什么有的公司抽检频率比较低?为什么有的公司产品检验的成本较低?如果对过程有了足够的理解,有了成熟的经验积累和有效的且合理的控制策略,当然鉴定成本会降低。或者说过程能力足够,过程的可靠度足够,那么“控制”成本也会降低,不需要“过度控制”。
如果对产生普通原因的过程要素进行了最佳的设定,对可能产生特殊原因的过程要素也进行了有效的识别和管控,那么过程从理论上是可控的和可靠的,这就需要标准化作业和变化点管理的基础。不同的影响因素,需要不同的控制方法。比如维护活动是主要变差来源,那就做好预防性和预知性维护,因为预防性和预见性维护也是属于控制方法。对于以过程设置为主的过程,工装和工艺参数的设定是绝大部分变差的来源,并且由于这样的过程一般具有很高的能力很稳定性,所以一般会设置或建立控制图的方法进行控制或管控,因为控制图也属于控制方法。请参见下面图片中FMEA参考手册和APQP参考手册的内容。
简单说一说质量管理:一个维度就是分析和识别出所有影响质量的因素,了解各种因素的作用机理及其对质量的影响,对各个因素采取合理且有效的控制策略,按照控制策略实施管控,如还有未知的或未管控到位的地方,重新分析和改进。另一个维度是将所有影响质量的因素进行合理且有效的标准化,在这个前提和基础上做好变化点管理,以确保任何时候过程或作业都符合规范或要求,以达到预期的质量水平。
既然SPC是一个工具,有时候达到目的后且在某些条件下可能就不再需要工具。也就是说要清楚什么时候需要用SPC,什么阶段用SPC。用第一章第H节的内容说就是:“适当使用SPC可以使一个组织关注产品和过程的质量改进”。注意,是适当使用哦!另外,SPC也不一定是达到目的的唯一方法。所以SPC也好,控制图也好,都不是必须的且唯一的,除非顾客有强制要求。但是,也无需过分怀疑SPC的作用和价值,尤其是经过大约上百年的发展和研究,SPC已经形成了非常成熟的理论框架和基础,也有了非常成熟的应用经验和技巧。
控制图的控制限的修改
对于“受控”的过程,改进工作的重点将经常放在减少过程中的普通原因变差上。减少了这种变差就会“缩小”控制图上控制限(即经重新计算的控制限将相互靠近或上下控制限之间的距离更近)。许多不熟悉控制图的人觉得这样做对过程的改进是一种“惩罚”,可能会认为缩窄控制限后点子更容易出界,那时因为它们没有意识到如果一个过程稳定且控制限计算正确,过程错误地产生不受控的点的机会是相同的(即发生第1类错误的几率实现相同的),与控制限间的距离无关。
应该提到的一点是控制限的重新计算问题。一旦经过合适的计算,并且如果过程中普通原因变差没有发生改变,则控制限就是合理的,也就是说过程没有什么改进和改变,过程能力也没有改变的情况下就不需要重新修改控制限。出现变差的特殊原因的信号不需要重新计算控制限,因为只要受特殊原因影响的数据没有用于计算“控制用控制图”的控制限,特殊原因就不会对控制限产生影响。用于长期分析的控制图,最好是尽可能少重新计算控制限,只有当过程发生改变时才会重新计算。
下面图片是第二版《新编质量管理学》的内容:
第一章 第H节 控制图的有效使用和益处
关于SPC及控制图的作用和益处,在《统计过程控制SPC 第1部分》(可以点击链接查看文章)中已经有过介绍,所以在这里只是简单的重复一下。
通过使用控制图可以对过程进行持续地监控,能及时探测和识别特殊原因或异常,也有助于对过程未来状态进行越策,以便及时采取措施防止不合格的发生,达到提高质量,降低成本的效果。使用SPC监控过程至少可使过程保持在它当前性能水平上。但是,当SPC用作指导过程分析的方法时,就可以达到真正的改进。同时,因为控制图的使用,以及控制图对特殊原因的报警或预警,可以促使各部门更关注变差,也为各部门讨论过程性能提供(了)共同的语言,所以适当使用SPC可以使一个组织关注产品和过程的质量改进。