当微服务系统越来越庞大,各个服务间的调用关系也变得越来越复杂,需要一个工具来帮忙理清请求调用的服务链路。之前使用的是Sleuth+Zipkin的解决方案,最近发现应用性能监控(Application Performance Monitoring,APM)也可以很好地解决该问题。对比SkyWalking和Elastic APM之后,发现Elastic APM更胜一筹,今天我们来一波Elastic APM的使用实践!
Elastic APM 简介
Elastic APM是基于Elastic Stack构建的应用性能监控(APM)系统。它主要有如下用途:
- 用来实时监控应用性能信息,包括HTTP请求调用时长、数据库查询信息、缓存调用信息和外部的HTTP请求调用信息。有助于我们快速找出并解决性能问题。
- 自动收集应用中未处理的错误和异常,显示异常的堆栈信息,有助于快速定位异常和了解出现频率。
- 度量指标是调试生产系统时的另一个重要信息来源。Elastic APM Agent 会自动收集主机级别的度量指标(比如Java JVM和Go Runtime的指标)。
- 支持分布式请求链路追踪,使你能够在一个视图中分析整个服务架构的性能问题。
相关组件
Elastic APM 包括四大组件: APM Agent, APM Server, Elasticsearch, Kibana。
- APM Agent:以应用程序库的形式提供,负责收集应用运行时的性能监控数据和错误数据,短时间缓存后发送APM Server。
- APM Server:一个独立的组件,负责接收APM Agent中发送的性能监控数据。验证并处理完数据后,会转存储到Elasticsearch中,之后就可以在Kibana APM 应用中查看性能监控数据了。
- Elasticsearch:用于存储应用性能监控数据并提供聚合功能。
- Kibana APM app:可视化查看APM性能监控数据,有助于找到性能瓶颈。
数据模型
Elastic APM Agent 从其检测的应用程序中捕获不同类型的信息。这些操作被称为事件,可以是Span, Transaction, Error, or Metric。
- Span(跨度):Span包含一次操作过程中代码执行路径的信息。它从操作的开始到结束进行度量,并且可以与其他Span具有父/子关系。
- Transaction(事务):Transaction是一种特殊的Span,具有与之关联的其他属性。它描述了Elastic APM Agent捕获的最高级别事件,比如一次请求、一次批处理任务等。
- Error(错误):Error事件至少包含错误发生的原始异常或创建的日志的信息。
- Metric(度量):APM Agent 自动获取基本的主机级别指标,包括系统和进程级别的CPU和内存指标。也可以获取特定于代理的指标,例如Java Agent中的JVM指标和Go Agent中的Go运行时指标。
使用实践
学习了上面的基本概念之后,是时候来波实践了,接下来我们将使用Elastic APM来监控SpringBoot应用的性能信息。
安装Elasticsearch和Kibana
安装Elastic APM之前,我们需要先安装好Elasticsearch和Kibana,注意使用7.6.2版本。
安装APM Server
- 下载APM Server的安装包,下载地址:https://www.elastic.co/cn/downloads/past-releases/apm-server-7-6-2
下载完成后解压到指定目录;
- 修改配置文件apm-server.yml,修改下Elasticsearch的连接地址即可;
output.elasticsearch: hosts: ["localhost:9200"]
- 使用如下命令启动APM Server即可,启动成功APM Server将在8200端口运行;
apm-sever -e
- 在Kibana中检测APM Server是否启动成功,访问地址:http://localhost:5601/app/kibana#/home/tutorial/apm
SpringBoot集成APM Agent
Java应用集成APM Agent的方式有三种,我们使用最简单的方式,直接在应用中集成。
- 在pom.xml中添加相关依赖;
<!--Elastic Agent相关依赖--><dependency> <groupId>co.elastic.apm</groupId> <artifactId>apm-agent-attach</artifactId> <version>1.17.0</version></dependency>
- 在应用启动类的main方法中添加Elastic APM的Attach API;
@SpringBootApplicationpublic class MallTinyApplication { public static void main(String[] args) { ElasticApmAttacher.attach(); SpringApplication.run(MallTinyApplication.class, args); }}
- 在resource目录下添加Elastic APM的配置文件elasticapm.properties;
# 配置服务名称service_name=mall-tiny-apm# 配置应用所在基础包application_packages=com.macro.mall.tiny# 配置APM Server的访问地址server_urls=http://localhost:8200
- 在Kibana中检测APM Agent是否启动成功,访问地址:http://localhost:5601/app/kibana#/home/tutorial/apm
查看性能监控信息
- 打开监控面板以后,可以发现我们的mall-tiny-apm服务已经存在了;
- 多次调用应用接口,即可查看到应用性能信息;
- 打开某个Transaction查看详情,我们可以看到连SQL执行耗时信息都给我们统计好了;
- 不仅如此,打开执行查询的Span查看详情,连SQL语句都给我们收集好了;
- 在项目中添加一个有远程调用接口,看看能不能收集到请求调用链路;
/** * 品牌管理Controller * Created by macro on 2019/4/19. */@Api(tags = "PmsBrandController", description = "商品品牌管理")@Controller@RequestMapping("/brand")public class PmsBrandController { @ApiOperation("远程调用获取所有品牌信息") @RequestMapping(value = "/remoteListAll", method = RequestMethod.GET) @ResponseBody public CommonResult<List<PmsBrand>> remoteListAll() { //模拟耗时操作 ThreadUtil.sleep(1, TimeUnit.SECONDS); //远程调用获取数据 String response = HttpUtil.get("http://localhost:8088/brand/listAll"); JSONObject jsonObject = new JSONObject(response); JSONArray data = jsonObject.getJSONArray("data"); List<PmsBrand> brandList = data.toList(PmsBrand.class); return CommonResult.success(brandList); }}
- 发现完全可以,Elastic APM完全可以取代Sleuth+Zipkin来做微服务的请求链路跟踪了;
- 使用我们之前springcloud-learning中的微服务调用案例,也是可以进行请求链路跟踪的;
- 再来看下应用主机的度量信息,非常全面,CPU、内存、JVM信息都有了,以后性能调优的时候可以看看!
总结
Elastic APM 完全可以取代Sleuth+Zipkin来做分布式请求链路追踪,并且提供了数据库及缓存调用时长的统计,很好很强大!不止于此,它还可以用来实时监控应用性能信息及度量指标,连错误日志也收集好了,是一款很好的应用性能监控工具!