Splunk中国区总经理,严立忠
正确地运用人工智能(AI)和机器学习,通过加强IT运营流程和工作的自动化,将会极大地简化IT的运营。IT已经变得越来越复杂,用户迫切需要能够简化工作流程的技术。智能自动化的预测分析将取代人工密集型任务。IT部门能够利用数据和人工智能迅速发现潜在的问题,提出解决现有问题的建议,通过自助服务和自我恢复功能简化自动化流程,并预测未来的结果,从而估算出成本,优化资产回报。
Gartner发现了这一趋势,创造了“面向IT运营的人工智能(AIOps)”这一术语。试想一下,系统能够为那些我们尚未想到的问题提供深刻见解——这正是AIOps的潜力所在。
AIOps不仅能够提供解决问题的建议,还可以从过去的行为和解决方案中学习,自动解决问题和预测故障,由此极大地简化了IT。这要求机器的配置状态具备可见性,还要理解过去的行为和交互——包括好的和坏的。AIOps通过自动应用深度分析,确保在高性能IT环境下能够主动做出决策,最终让业务更加健康的运行,从而进一步提高了IT运营分析(ITOA)能力。
DevOps对于业务必不可少:高速发展还是缓慢前行
DevOps是 Development和Operations的组合,可以把DevOps看作开发(软件工程)、技术运营和质量保障(QA)三者的交集。
传统的软件组织将开发、IT运营和质量保障设为各自分离的部门。在这种环境下如何采用新的开发方法,这是一个重要的课题:按照从前的工作方式,开发和部署不需要IT支持或者QA深入的、跨部门的支持,而却需要极其紧密的多部门协作。现在,DevOps考虑的是一套针对这几个部门间沟通与协作问题的流程和方法。
虽然企业高层还不太熟悉DevOps,但它是当今高度复杂和快速发展的环境中建立并保持竞争优势的关键所在。随着每一家企业都将成为数字化企业,企业开发并交付的数字服务将决定其业务的沉浮。竞争力取决于交付速度、客户体验质量以及数字服务所实现的业务目标。DevOps不仅使数字服务交付的更快,而且更高效,并能让团队的工程和运营人员更好的参与进来。要做到这样,机构必须具备灵活性,以便轻松的提高团队开发和交付服务的技能、流程和技术。
为实现DevOps所承诺的速度、质量和业务影响,机构将继续采用新的人员配置方法和新技术,为团队提供支持,使团队更敏捷。从吸收部门新概念(例如,自我管理团队和松散耦合的工具链等),到吸收新技术例如,容器、微服务、“功能即服务”解决方案,以及采用少代码/无代码方法开发软件等,机构将经历不断的变化。因此,DevOps不仅意味着不同部门对生产服务的质量和性能有统一全面的理解,而且对软件开发、构建和发布过程所涉及的质量和性能也有统一全面的理解。
只有掌控好DevOps计划的高管才能脱颖而出。高管们的谈话围绕速度和竞争力,而指出DevOps实施的成功之处并用数据来证明其影响才是关键所在。
DevSecOps——下一个前沿
为满足不断提高的管理、审计和合规要求,同时保持发展速度,很多团队都将采用DevSecOps。正如IT部门正在进行优化,在其交付平台和应用程序中置入更多的监测功能,他们的安全需求也会随之优化。这意味着开发人员将发挥更大的作用(以及更多的责任),以确保其应用程序和所处理数据的安全。同样,安全部门还应该更多的与开发和运营部门协作,以保证应用程序和交付过程的安全。
为了应对越来越老练的数字对手,企业必须促进此前相互独立的IT部门和安全部门之间更好的协作,以提升运营安全战略,获得业务成果;同时还要增强运营保护、检测和响应能力,降低IT风险,减少网络安全威胁和欺诈。
这里有个很好的案例:自从部署了领先的机器数字平台Splunk Enterprise、能够实时监测业务运营后,全中国发展最快的互联网金融服务供应机构——快钱公司可以轻易地追踪系统的异常情況并加以分析,积极减轻系统问题,可用性大大提高。配合其自行开发的大数据分析系统,该公司可以通过Splunk平台提升整体安全性,并且加强预防外来的入侵。其它问题也可以在1至2秒內定位,例如交易延迟、系统停机和支付转账失败等,达到“秒级报警”的目标。即使是最复杂的故障排解任务,也可以在2至3分钟以內完成。
安全将成为构建企业级服务和应用程序的标准要求。不仅开发人员、发布管理人员和应用程序专家要参与进来,运营和安全部门也要参与,而DevOps部门则被要求坚持做好应用程序交付工具链的管理和审计控制工作。为实现这一协作举措,每名参与人员都需要使用真实的数据源——使用这些数据来实现与其角色最相关的安全目标。
不再有界限——企业之间的透明度
采用“可组合”的新方法来提供业务服务,包括SaaS、容器和API,传统的关于企业如何交付和运营应用程序的概念不再适用。为能够在当今激烈的竞争环境中生存下去,IT部门应与第三方协作以提高开发速度,提供更可靠的服务。IT部门将依靠很多这类第三方公司,包括从外包开发,到借助于云或者服务提供商提供的服务等各种工作。这就要求IT运营部门能全面掌握各种内部和外部服务,无论在防火墙内部还是外部,都能够共享运营信息,进一步提高透明度。
API将使所需透明度得以实现,帮助形成跨越客户、供应商、员工和企业的生态支持系统的基础。这将开启企业应用程序的新功能,以支持更快速的服务实验和开发,也使对应用程序运行的安全性和可见性需求增加。
新型IT运营人员
随着持续交付和DevOps的兴起,一批新的IT运营专业人员正在定义怎样交付和管理服务。在配置和容量方面与Python和Ruby一样匹配,他们在系统自动化、架构灵活性、开发人员授权和网站可靠性等方面处于领先地位,能够更快地交付更好的应用程序,并且有很好的用户体验。
2017年度Splunk公共部门IT运营调查,与去年相比,至少60%的公共部门IT专业人士对履行职责的信心有所下降。Splunk软件为IT和安全专业人员提供了分析解决方案,有助于提高其信心。很多专业人员不断提高他们的软件开发技能,以便更有效地与开发人员协作,因此,网站可靠性工程师(SRE)的角色将成为主流。