我在IT运维领域也算是一个“老司机”了,处理各种应用的upgrade,许多产品的patch,多种系统资源的scale out,随着IT资源越来越多,我这个IT运维“老司机”感觉到压力也越来越大。下班后被老板叫回办公室,处理IT资源紧急维护的次数越来越多了,一些不可预知的IT资源的故障,迫使许多个应该在家里床上睡觉的夜里,都是在公司IT运维办公室里面度过的。
上个月和几个同行运维工程师一起吃饭聊天,其中一个“老司机”张工,说话的神情和语气,明显感觉到和以前抱怨,吐槽的主基调不一样了,仔细听他一说,原来是他们的IT运维新上了一个运维平台,使他们公司的运维工作上了一个全新的高度。该平台就是Oracle的Application Performance Monitoring Cloud Service,没有听明白?翻译过来就是甲骨文应用性能监控云服务移动解决方案。下面我们简称为APMCS。这真是高大上啊,我们几个都不由自主的听张老司机说起了APMCS的种种好处和便利。
首先,实现了集局域网监控、互联网监控、告警通知、数据收集、视图展现、APP移动端监控于一身,实现梦想中的轻松运维,移动化运维;其次,实现了事前预警,在故障出现之前,管理人员应该能在任何时间,任何地点接收到告警信息,并及时处理问题,把故障隐患扼杀在摇篮中;然后,实现了事中恢复,天有不测风云,即使是再完美的方案也可能有预料之外的故障,为保证在最短时间内恢复业务,关键数据不因故障丢失,有完整备份方案来应对自如,在移动方案的前提下,能实现远程切换;最后,实现了事后存档,强调运维管理的方法,针对处理过的故障,能记录在案,在处理过程当中运用过的处理技术,处理方案,有详细的操作记录,方便查找与故障跟踪。
这样不仅能满足我们对运维的要求,解放生产力,还能使我们的运维管理更加规范化,标准化,从而真正意义上的实现自动化,移动化运维。医生从来不会简单地治疗症状,他们会使用预防性的药物,努力给他们的病人最好的护理。IT运维应当以相同的方式处理,主动性、预防性的方法将提升运维效率、提高应用的性能和保证应用的持续可用性。
听张老司机啰里啰嗦的说了那么多,我这个IT消防员也赶紧的恶补了一下这方面的知识,接下来我们一起了解一下Oracle公司,在企业运维管理领域,提出了怎样的解决方案呢?一起看一下Oracle Application Performance Monitoring Cloud Service (APMCS)
*APMCS移动化
IT运维人员怎样从IT消防员的角色,转换为IT服务人员的角色,这就需要我们提前洞察IT资源的运行情况,将不可控的事故都消灭的萌芽阶段。这就需要我们IT运维人员能实时的监控,实时的进行处理。APMCS在监控服务请求,监控应用性能等核心模块,实现了移动终端的显示,真正实现了在家里也能实时了解IT资源的运行情况,做到了枕边的仪表盘。
下面是APMCS 移动化Demo的主界面和主要监控资源界面。
我们可以通过APMCS移动化终端可以监控资源运行情况,比如是正常运行还是处于非正常运行状态,可以实时的收到系统的运行情况报警,根据系统的运行情况,进行IT资源的预警、调配和控制。
除了能实时进行IT资源运行情况的监控以外,我们还可以通过APMCS的REST API接口实现IT资源的控制,实现移动化IT运维。
*APMCS云服务监控
现在IT资源的建设和规划,越来越离不开云计算,和移动化。云计算能够使企业复杂的IT资源简单化,移动化能够使企业的IT资源便捷化。Oracle 的APMCS移动解决方案正是在云计算,云服务的基础上结合移动化,实现快速隔离,快速定位问题,快速解决问题,准确洞察复杂多层应用请求处理情况,解决IT运维过程中的诸多痛点和难点的运营平台。APMCS的特点:
能够知道用户Web应用的真实用户体验。
能够分析用户AJAX请求的相关性能数据。
能够定位到应用层具体服务或方法层级粒度的性能数据。
能够自动发现和分析基于应用的服务级别的调用关系。
能够实现统一的应用程序日志分析和应用性能监控。
能够根据上下文,实现应用层,数据库层和其他应用层性能负载关系的分析。
能够实现整个IT堆栈资源利用率的分析。
能够定位导致发生严重问题的僵死线程,帮助快速定位问题。
*APMCS功能介绍
通过上面的APMCS的构架,我们可以看到,通过APMCS可以实现IT资源Web页面层性能监控,网络传输层监控,应用服务层性能监控,应用事物集成层监控,以及数据库层性能的监控,通过实时的性能监控,分析系统的运行瓶颈,提高最终用户体验,提升系统性能,更快的发现和解决性能问题。
APMCS是Oracle Management Cloud(OMC)的一部分,OMC是基于SAAS的IT运营解决方案,该运营平台主要解决了如下的问题:
第一,OMC是IT运营解决方案的完整套件,解决了传统的运维工具纷繁复杂,运维操作杂乱繁重的问题。
第二,OMC支持所有的异构环境,能监控公有云产品构架,私有云产品构架,还能监控混合云构架,不仅能监控Oracle的软件产品,也能监控非Oracle的产品,比如:Java Cloud Service,Database Cloud Service,Oracle,Weblogic,DB2,SQL Server,Tomcat等软件产品。
第三,OMC实现真正的快速交付价值,将人力资源从繁重的IT运维中解脱出来,更关注核心的业务价值。比如通过OMC可以实现,故障诊断,资源分析,业务洞察,IT预测,安全监控与分析,基础构架监控,应用性能管理,并且包括告警与通知等功能。
如果你想更多的了解APMCS移动解决方案的相关信息,通过下面的资源更进一步的了解该产品。
*相关资源
https://cloud.oracle.com/application-performance-monitoring
Twitter: https://twitter.com/OracleCloudZone
Facebook: https://www.facebook.com/OracleCloud
LinkedIn: http://www.linkedin.com/grp/home?gid=3262238
YouTube: https://www.youtube.com/user/OracleCloudComputing
Blog:https://blogs.oracle.com/cloud/