《智能运维等级白皮书 》南宁轨道交通集团有限责任公司 城市轨道交通列车通信与运行控制国家工程实验室联合发布白皮书 编号:WP-2019003
https://zhuanlan.zhihu.com/p/100335823
1. 轨道交通RAMS 可靠性 可用性 可维修性安全性
2. 要实现安全性和可用性的目标,基础工作:
控制设计因素:做好系统的可靠性和可维修性的设计
控制运行因素:控制好好环境条件 人为因素 运行程序 后勤保障
控制维修因素:人为因素 维修程序 服务保障
3. 可维修性是指在规定的条件下 使用规定的程序和资源进行维修时 对于给定条件下的产品在规定时间区间内 完成指定的实际维修工作的能力 一般使用平均修复时间来进行衡量
系统可用性的可维修性包括:
执行预防性维修时间
故障检测 之别及定位的时间
失效系统的修复时间
系统重启恢复及测试调整的时间
系统安全性可维修性包括:
与安全相关失效模式或危害有关的系统中子系统或其部件维修的方便性
系统安全有关部件在维修工作期间分内发生错误的概率
系统恢复到安全状态的时间
4. 运维管理 轨道交通运营企业依据生产经营目标 为保持或恢复设备规定功能所进行的所有技术和管理工作 包括监督活动
维修程序 包括预防性维修和维复性维修
人为因素管理 主要控制对系统安全性和可用性的影响
服务保障管理 包括人员安全措施 能力培训方案要求 备件备品 工具物料 系统运输 包装 搬运和贮存条件 供应商售后服务等
5. 关键设备:指发生硬件故障或软件失效 可能导致人员伤亡 行车中断 列车掉线等后果的运营设备(关键设备为主要管控对象)
6. 智能运维 关键系统和设备故障自诊断、远程及汇总检测、专家系统综合决策、故障预测等健康管理 综合智能维修系统 (移动通信 云计算 大数据 人工智能 物联网)
在线更换单元??? 在日常维修过程中,可使用标准工具进行整体更换的模块化产品
智能运维等级
故障过程:故障检测 故障响应 故障定位 故障修复
减少故障持续时间实现系统可用性提升是运维管理的主要目标之一
1. 状态本地检测:以现场设备状态指示 各子系统终端分散检测为主 设备状态巡视及故障检测 需要到设备本地完成 工作效率低 故障持续时间长
(指示灯 显示屏 子系统工作站 便携式工具 人工检查)
2. 智能状态巡检:实时采集并远程集中检测设备状态 对状态数据进行智能分析 一统计结果集中呈现设备故障情况 代替人工巡视及数据分析过程 实现智能状态巡视 大幅缩短故障检测时间 可维修性指标得到提高 但仍可能存在故障通知 相应不及时的情况 导致故障持续时间增加
• 远程集中监测:采用多类传感器技术至少时间关键设备在线可更换单元工作状态监测功能 将采集到的运行状态及报警数据,通过有线或无线网络,发送到远程服务器进行集中存储和可视化呈现 实现系统远程集中监测,并根据实际需要进行多子系统多专业、多线路的运程集中监测
• 智能设备巡视系统对各种传感器状态数据进行自动巡视分析 根据预定判据及数据分析算法判断设备的工作状态 将系统所有设备运行状态巡视结果,以统计形式实时集中在一个页面呈现,代替人工巡视和数据分析过程
3. 智能联动管理:通过设备与管理系统数据互联 系统故障信息自动推送给现场维修处置人员移动端 缩短了故障相应时间,进一步提高可维修指标,但故障诊断和恢复仍主要依靠现场维修人员的经验能力,存在故障不能及时修复的情况
• 根据维修计划 设备实时状态 维修人员排版计划 自动生成计划及故障维修工单 智能推送到正确的现场执行人的移动端 维修人员按照工单展开工作
• 运维数据域可视化 包括故障原因综合分析(故障时间 安装地点 故障现象 故障功能原因 报警等级 维修人员 设备厂家)全周期(设计数据 生产数据 安装数据 测试数据 预防性维护数据 纠正性维护数据、故障数据 更换数据 返厂修数据 更新改造数据 退役报废)
• 运维指标监控 (安全指标 可靠性指标 可维修性指标 可用性指标 正点率 兑现率)运营耽误数据 计划性维护工单数据 故障功能维修工单数据 运维成本数据 维修人员 物资工具等各种运维指标相关数据的可视化监控和主题分析。
• 运维管理改善
1.维修人员在移动端随时录入现场工作记录,实现了维修记录数字化 2.现场维修人员可从移动端访问设备技术资料 维修文档 历史纹绣工单 故障数据 备件工具等;维修管理人员通过移动端,可快速查看设备及维修执行情况,提高工作效率;移动端数据可有效协助基层和决策层开展工作,数据价值开始展现 3.故障分析时,可运程访问并下载故障分析所需数据 大幅提升问题解决效率 4.随时随地检查现场维修记录 实现闭环管理 5.协助维修人员深入分析故障原因和管理中的问题
(生产调度可事实了解维修人员在班情况、任务工单执行情况 物资管理人员可事实了解各仓库备品备件余量 数量达到报警阈值时,可通过手机移动端接收报警信息,提示物资管理人员及时补充备品备件 减少维修管理工时)
4. 智能诊断决策:通过开发专家系统,实现故障智能诊断定位,并给出合理故障处置建议,缩短了故障定位和修复时间,可维修性指标持续提升,人员智能要求降低 运维成本减少
• 线网内数据互联与共享,建立关键性设备的可靠模型,并根据实时设备状态对模型进行动态调整,建立轨道交通领域的安全和服务风险模型 实现风险评估数据模型的标准化以及面向全领域的动态风险提示
• 实现系统故障系统定位,故障处置自动建议、自动应急决策建议、数据联通运维体系各环节
• 可靠性数据模型 基于RAMS规范,影响故障失效或软件功能异常的可靠性数据模型建立,相应影响因素(人为因素 设备因素 环境因素 管理因素)全面数字化,可视化,在设备状态指标发生偏离时,基于可靠性数据模型,可快速分析到与之关联的影响因素 实现故障原因自动诊断
• 确定维修策略 监测項(性能参数 黄精参数)维修周期(固定周期 固定里程 实时监测) 维修内容(清洁保养 外观检查 状态检查 功能检查 指标测试 局部调整 部件更换 软件优化 数据备份) 维修想状态标准(健康状态 亚健康状态 故障状态)维修资源要求(人员数量 技能要求 备件 维修工具及设施 耗时 成本)
5. 智能故障预测:通过人工智能及大数据技术应用 实现故障预测与健康管理,故障数量及维修工作大幅减少,运维工作已故障预防为主,设备故障和运维成本最大化降低
• 在故障预测方面:根据不同设备的可靠性模型和状态监测结果,自动生成预测修计划,现场维修人员根据推荐的维修建议 实时预防保养 性能监测恢复 消耗部件更换 寿命到期更新不同的维修内容 保持设备处于良好的设备状态
• 故障预警:在检测到设备处于亚建康时 及时预警 根据设备故障可靠性模型和影响因素 自动输出合适的处置建议 使设备及时恢复到健康状态
• 在设备健康管理方面:基于事实数据监测及智能评估,定期自动生成设备健康状态报告 并自动推送维修管理人员系统端 全面及时掌握设备状态
• 维修报告 包括维修人员 时间 地点 设备 维修记录 维修结果 维修用时 维修用料 维修工具 更换部件 维修综合总费用(自动评估维修人员工作效率及质量)
• 智能预测采购需求(备件 工具 物料)人力需求 更新改造需求 维修资金需求
• 用户数据中心定期将设备状态数据 数据分析报告 健康检测报告 维修信息 推送到产业链上下游单位 自动督促相关责任单位反馈设备根本故障原因及改善建议 全面提升系统RAMS指标
• 预测性计划确定的物料使用需求 以及故障修计划的物料消耗情况当用户物料库存量定于预设值是 自动触发采购需求订单 供应商单位根据合同提前约定的时间和佳哥 提前和及时交付物料到用户
智能运维等级划分