Kubernetes Expansion and Contraction
Kubernetes Expansion and Contraction
在实际生产系统中,经常会遇到某个服务需要扩容的场景, 也可能会遇到由于资源紧张或者工作负载降低而需要减少服务示例数量的场景。因此可以利用 Deployment/RC 的 Scale 机制来完成这些工作。
Kubernetes 的 Pod 的扩容和缩容操作提供了手动和自动两种,手动模式提供执行 kubectl 命令对一个 Deployment/RC 进行 Pod 副本数量的设置,即可一键完成。自动模式则需要用户根据某个性能指标或者自定义业务指标,并制定 Pod 副本数量的范围,系统将自动在这个范围内根据性能指标的变化进行调整。
手动扩容和缩容模式
在 Deployment Nginx 为例:
nginx-deployment.yaml
apiVersion: apps/v1beta1
kind: Deployment
metadata:
name: nginx-deployment
spec:
replicas: 3
template:
metadata:
labels:
app: nginx
spec:
containers:
- name: nginx
image: nginx:1.7.9
ports:
- containerPort: 80
创建服务:
$ kubectl apply -f nginx-deployment.yaml
deployment "nginx-deployment" created
已运行的 Pod 副本数量为 3 个:
$ kubectl get pods
NAME READY STATUS RESTARTS AGE
nginx-deployment-569477d6d8-44xsn 1/1 Running 0 27s
nginx-deployment-569477d6d8-g4b8f 1/1 Running 0 27s
nginx-deployment-569477d6d8-sdfsm 1/1 Running 0 27s
通过 kubectl scale 命令可以将 Pod 副本数量从初始的 3 更新为 5:
$ kubectl scale deployment nginx-deployment --replicas 5
deployment "nginx-deployment" scaled
查看 Pod 数量:
$ kubectl get pods
NAME READY STATUS RESTARTS AGE
nginx-deployment-569477d6d8-44xsn 1/1 Running 0 1m
nginx-deployment-569477d6d8-bqm2b 1/1 Running 0 16s
nginx-deployment-569477d6d8-dmgfk 1/1 Running 0 16s
nginx-deployment-569477d6d8-g4b8f 1/1 Running 0 1m
nginx-deployment-569477d6d8-sdfsm 1/1 Running 0 1m
将 --replicas 设置为比当前 Pod 副本数量更小的数,系统会将 “杀掉” 一些运行中的 Pod,以实现应用集群缩容:
$ kubectl scale deployment nginx-deployment --replicas=1
deployment "nginx-deployment" scaled
$ kubectl get pods
NAME READY STATUS RESTARTS AGE
nginx-deployment-569477d6d8-44xsn 0/1 Terminating 0 3m
nginx-deployment-569477d6d8-bqm2b 0/1 Terminating 0 1m
nginx-deployment-569477d6d8-dmgfk 0/1 Terminating 0 1m
nginx-deployment-569477d6d8-g4b8f 0/1 Terminating 0 3m
nginx-deployment-569477d6d8-sdfsm 1/1 Running 0 3m
自动扩容和伸缩模式
从 Kubernetes v1.1 版本开始,新增了名为 Horizontal Pod Autoscaler(HPA)的控制器,用于实现基于 CPU 使用率自动 Pod 扩容和缩容的功能。HPA 控制器基于 Master 的 kube-controller-manager 服务启动参数 --horizontal-pod-autoscaler-sync-period 定义的时长(默认值为 30s),周期性的检测目标 Pod 的 CPU 使用率,并在满足条件时对 ReplicationController 或 Deployment 中的 Pod 副本数量进行调整,已复核用户定义的平均 Pod CPU 使用率。Pod CPU 使用率来源于 Heapster 组件,所以需要预先安装好 Heapster。
创建 HPA 时可以使用 kubectl autoscale 命令快速创建或者使用 yaml 配置文件进行创建。
在创建 HPA 之前,需要一件存在一个 Deployment/RC 对象,并且该 Deployment/RC 中的 Pod 必须定义 resources.requests.cpu 的资源请求值,如果不设置该值,则 Heapster 将无法采集到该 Pod 的 CPU 使用情况,会导致 HPA 无法正常工作。
下面通过为一个 RC 设置 HPA,然后使用一个客户端对其进行压力测试,对 HPA 的用法进行示例。
以 php-apache 的 Deployment 为例,使用 cpu request 为 200m,为设置 limit 上限的值:
php-apache-deployment.yaml
apiVersion: apps/v1beta1
kind: Deployment
metadata:
name: php-apache
spec:
replicas: 1
template:
metadata:
name: php-apache
labels:
app: php-apache
spec:
containers:
- name: php-apache
image: gcr.io/google_containers/hpa-example
resources:
requests:
cpu: 200m
ports:
- containerPort: 80
创建服务:
$ kubectl apply -f php-apache-deployment.yaml
deployment "php-apache" created
再创建一个 php-apache 的 Service,提供客户端访问:
php-apache-svc.yaml
apiVersion: v1
kind: Service
metadata:
name: php-apache
spec:
ports:
- port: 80
selector:
app: php-apache
创建服务:
$ kubectl apply -f php-apache-svc.yaml
service "php-apache" created
接下来为 Deployment 创建一个 HPA 控制器,在 1 和 10 之间调整 Pod 的副本数量,使得平均 Pod CPU 使用率维持在 50%。
使用 kubectl autoscale 命令进行创建:
$ kubectl autoscale deployment php-apache --min=1 --max=10 --cpu-percent=50
deployment "php-apache" autoscaled
或者通过 yaml 配置文件来创建 HPA,需要在 scaleTargetRef 字段指定需要管理 Deployment/RC 的名字,然后设置 minReplicas、maxReplicas 和 targetCPUUtilizationPercentage 参数:
hpa-php-apache.yaml
apiVersion: autoscaling/v1
kind: HorizontalPodAutoscaler
metadata:
name: php-apache
spec:
scaleTargetRef:
apiVersion: apps/v1beta1
kind: Deployment
name: php-apache
minReplicas: 1
maxReplicas: 10
targetCPUUtilizationPercentage: 50
创建服务:
$ kubectl create -f hpa-php-apache.yaml
horizontalpodautoscaler "php-apache" configured
查看已经创建的 HPA:
$ kubectl get hpa
NAME REFERENCE TARGETS MINPODS MAXPODS REPLICAS AGE
php-apache Deployment/php-apache <unknown> / 50% 1 10 1 4m
然后创建一个 busybox Pod,用户对 php-apache 服务发起压力测试的请求:
busybox-pod.yaml
apiVersion: v1
kind: Pod
metadata:
name: busybox
spec:
containers:
- name: busybox
image: busybox
command: ["sleep", "3600"]
创建服务:
$ kubectl create -f busybox-pod.yaml
pod "busybox" created
进入 busybox 容器,执行一个无限循环的 wgat 命令来访问 php-apache 服务:
$ kubectl exec -it busybox sh
$ while true; do wget -q -O- http://php-apache > /dev/null; done
注意这里 wget 的目的 URL 地址是 Service 的名称 “php-apache”,这要求 DNS 服务正常工作,也可以使用 Service 的虚拟 ClusterIP 地址对其进行访问,例如http://169.169.122.145:
等待一段时间后,观察 HPA 控制器搜集到的 Pod CPU 使用率:
$ kubectl get hpa
再过一会,查看 Deployment 副本数的变化:
$ kubectl get deployment php-apache
可以看到 HPA 已经根据 Pod 的 CPU 使用率的提高对 Deployment 进行了自动扩容,Pod 的副本数量变成了 10 个。
最后停止压力测试,在 busybox 的控制台输入 Ctrl+C,停止无限循环操作。
等待一段时间,观察 HPA 的变化:
$ kubectl get hpa
再次查看 Deployment 的副本数量:
$ kubectl get deployment php-apache
可以看到 HPA 根据 Pod CPU 使用率的降低对副本数量进行了缩容操作,Pod 副本数量变成了 1 个。
当前 HPA 还只支持将 CPU 使用率作为 Pod 副本扩容和缩容的触发条件,在将来的版本中,将会支持应用自定义指标(例如每秒请求数量、请求平均响应时间或其他业务指标)作为触发条件。