产品上线后,总会有各种各样的问题出现。如何快速、高效的解决问题,关系到用户的满意度。对于一个产品而言,非常重要。问题解决的不及时,用户的抱怨就会接连而至,轻则投诉,重则放弃使用你的产品。通过这篇文章,总结一下在产品运营过程中遇到的各种问题,以及问题处理的一些基本原则和技巧。希望即使是小白产品,也能在阅读完这篇文章后,能够轻松应付线上的各种问题。
稳定压倒一切
一般在某次产品版本发布后,问题会大面积爆发。而且很多情况下,性质都是非常严重的。比如,错误的修改了原来的业务逻辑;系统运行缓慢或宕机;用户交互变动太大,用户无法接受。这些问题都会让用户极度不爽,投诉电话会打到爆。
这个时候,脑中请默念两个字:“稳定”。逻辑错误,请立刻回退版本,回头再谈修复的事。系统性能出现问题或宕机,请立刻尝试重启,并同步分析根本原因。以上谓之系统“稳定”。另一方面,需要保持和用户的持续沟通,安抚用户情绪。目前问题解决到哪一步了,预计什么时间可以恢复;我们为什么要这么设计,如果你觉得用的不爽,我们虚心接受你们的意见,尝试讨论更有效的方案。以上谓之用户“稳定”。所有的目标都奔着一个字“稳”,动作一定要快。只有稳定了,已有业务才不会受到影响,你也才能有精力开始排查问题。
追根溯源
一般先从本次的改动开始排查。这一次修改了哪些逻辑,哪些数据,基本上一查马上就能发现问题。这种问题也是最好排查的。
还有一些问题隐藏的比较深,没有那么容易排查。但是也有一定的套路可遵循。一般分为以下几个步骤:
排查内部问题
1.询问资深成员。有些问题不是第一次出现,在团队内随便问一下,也许就会有问题处理经验的人告诉你原因。这也是最快、最直接的方式。
2.借助工具。一个完善的产品,一般都会配套对应的监控系统,对系统的核心业务数据进行监测。通过查看错误日志,就能发现问题。
3.借助数据。若没有配套的监控系统,只能直接到数据库里去查询相关表数据,分析问题。这种要求对业务以及表结构有较深的了解。
寻找外部原因
若未发现自身问题,择要开始考虑是外部因素。
1.也许是上下游系统出现了问题,但一定要有数据或日志作为证据,否则便是浪费别人的时间。
2.一定要找对人,并且要求对方给予明确的时间承诺。
3.与外部系统定义明确的接口指标,确保成功率与时效性。
改进与思考
每一个发生的问题都值得仔细推敲。为什么经过我们的层层把关,仍然出现了问题?说明目前的机制还存在漏洞。因此对问题进行分析就显得非常有必要。
1.例行化问题分析过程。首先问题要有忠实的记录,任何一个问题都不能有遗留。要有例行的会议,提醒大家问题处理是一个长期的过程,而非间歇性的过程。要有专门的人员去处理,以免所有人都觉得这是其他人的事。
2.流程修补。问题在哪个环节出现的,就在哪个环节加强。首先是制度,规则,宣传。然后是一些强制的、技术化的手段来保证必然能被执行、一定会准确地被执行。
3.工具辅助。对关键业务进行监控,可以在问题出现时及时发现并处理。
4.建立问题处理机制。百密终有一疏,总会有问题出现。建立值班制度,应急处理制度,以不变应万变。