随着近几年互联网的飞速发展和普及,数据呈持续性爆发增长,“大数据”时代的脚步已悄然而至。而传统的火力发电厂也正逐步向数字化电厂迈进,各种数字化仪表与设备已取代原有的机械式仪表与设备,DCS、SIS乃至ERP等系统也已在各个电厂普及。各类传感设备、移动终端、数据采集设备等产生的大量数据被保存、分析,用于指导火力发电厂的生产运营。可见,火力发电厂在向数字化电厂迈进的过程中,已经感受到“大数据”对企业管理与运营带来的冲击。
1、面临的问题
数据的存储与保存,在信息技术日新月异的今天已不成问题,但对数据的分析应用乃至数据价值的深度挖掘却依然是摆在各个火力发电企业面前的难题。导致企业海量数据无法体现其深层价值的原因有3个方面:
1)不重视数据价值的挖掘。用平面、离散的眼光来看待数据,满足于各类生产实时数据的查看、统计报表的生成,没有重视数据间关系的分析及各类相关数据间的时间特性。
2)缺乏数据价值挖掘的长效机制。数据价值的深度挖掘,依靠数据分析模型逐步建立。如果没有对数据的长期分析跟踪,就不可能找到有效的分析模型。
3)缺乏专业知识高度融合的复合型人才。对数据进行分析,不仅需要具备火力发电厂的相关知识,也需要掌握足够的计算机专业知识,尤其是对各类数据库的理解与对结构化查询语句的熟练掌握。
2、火力发电厂的数据分析
数据在火力发电厂主要存在以下3类:第一类结构化数据。直接展现企业生产一线各种信息,数据价值密度高,由于其有严格的数据类型、标准的查询语言等特点,易于挖掘出更高的数据价值。第二类非结构化数据。不是生产一线数据,但往往与企业管理契合度较高,数据价值密度中等,数据价值挖掘难度较大;第三类,多媒体数据。大部分对生产而言价值较小,但对于事故的视频回放分析有很高的价值,所以其数据价值密度低,但数据价值挖掘难度大。
数据价值除了极少能直观表现出来,更多则隐含在枯燥数字的背后。在火力发电厂内,厂用电率指标的高低可以直接从指标信息中获得,是直观表现出来的,而导致厂用电率升高或降低的原因却隐藏在看似杂乱无章的数据洪流背后。对数据的分析越深入,就能获得越多的数据价值,分析后取得的数据价值密度要远远高于原始数据的价值密度。
数据的相关性分析是获得隐含数据价值的高效方式。数据可以存储在不同的数据库、不同的数据文件、不同的表空间、不同的表中,但是物理上的分离并不代表这些数据在逻辑上也是隔离的,在逻辑上这些数据恰恰是高度相关的。所以对数据价值的分析,必须将各相关数据看作一个整体,进行各数据间的相关性分级,然后建立模型。例如电厂厂用电率指标与各主要辅机耗电量有关,各辅机设备耗电量又与单台辅机的各项运行指标有关,任何一个指标的变动都会导致厂用电率改变。相关性分析就如同将厂用电率当作一个生命体,而辅机指标等相关数据集作为这个生命体的体征指标,用来衡量这个生命体的健康程度。
3、火力发电厂的数据挖掘
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。数据挖掘是伴随着数据的急速膨胀而发展起来的技术,没有数据挖掘技术,就不会在海量数据中发现数据的价值。伴随着“大数据”时代的到来,数据挖掘技术必将越来越重要。
数据挖掘不同于传统的数据分析(查询、报表等),数据挖掘可以得到有效可用且先前未知的信息,是不能靠直觉发现信息或知识的,甚至挖掘出的是出乎意料的信息。例如在美国某超市内,经过数据挖掘发现,购买婴儿尿布的男性有30%~40%会顺便购买啤酒,依据这一信息,超市将婴儿用品与男士用品靠近摆放,结果这个变动让此类商品的销售量成倍增长。可见,数据挖掘能发现有预见性的信息与知识。
数据挖掘的方法主要有神经网络方法、遗传算法、决策树方法、粗集方法等。在火力发电厂数据挖掘中,神经网络方法由于本身有良好的鲁棒性、自组织自适应性、并行处理、分布存储和高度容错等特性,非常适合解决数据挖掘的问题,因此被普遍采用。数据挖掘的任务有关联分析、聚类分析、分类、预测、时序模式和偏差分析等。只有完成这些才可以发现数据价值。一般用支持度和可信度2个阈值来度量关联规则的相关性,同时不断引入兴趣度、相关性等参数,使得所挖掘的规则更符合需求。
数据价值挖掘贯穿于企业信息化过程的整个生命周期。数据挖掘技术是数据价值挖掘最重要的方法。在数据价值挖掘中,必须重视企业所有原始数据的建模,尽量使得用于数据挖掘的数据条理清楚、关联清晰,尽可能结构化。可见,数据价值挖掘必须有配套的数据整体规划制度,将数据价值挖掘的思想贯穿于任何一个应用开发的整个生命周期,否则数据挖掘所取得的价值会大打折扣,难度也会成倍增加。可以说,企业信息化初期的规划、数据库的建模等决定了数据挖掘所能取得的知识和信息的多少。
在“大数据”时代,火力发电厂所产生的数据仅仅是整个社会数据海洋中的一滴水,如果将这滴水放入大海,挖掘出的数据价值将会成倍增长。例如火力发电厂与其设备制造厂都有针对设备和零部件的大量数据,但电厂保存的是设备的缺陷信息、生命期参数信息等数据,而设备制造厂保存的是设备部件材质、质检情况、流水线信息等数据。以往这些数据是割裂的,是信息孤岛,很少能一起用来进行数据挖掘。但“大数据”时代可以对这些数据价值进行深度挖掘,电厂的设备缺陷信息、生命期参数信息等数据可以反馈回设备制造厂家,用于设备改进以及更精准地进行市场定位。设备制造厂家的设备部件材质、质检情况、流水线信息等数据传递给电厂用来指导检修和设备状态调优。通过信息汇总后的数据挖掘,可以得到对双方都有用的数据价值,并且这些数据价值是不可能单独从一方的数据中挖掘得到的。
“大数据”时代,火力发电厂的数据会持续增长。面对海量数据,数据价值深度挖掘尤为重要,挖掘更多的数据价值意味着可以为企业节省更多的成本和创造更高的利润,否则就如同坐拥金山而不自知。努力提高信息化水平,培养专业人才,深度挖掘数据价值,必然是火力发电厂管理模式发展的趋势。