关于负载均衡和服务发现，Google的经验在这里

数人云老王：今天主要分享三个议题，首先是Google数据中心的简单介绍——Google数据中心约有200万台X86PC服务，没有买任何大、小型机，完全使用廉价的PC服务器搭建，因规模庞大，所以对网络要求非常高，交换机都是自行设计后定制的。服务发现、负载均衡的问题，对于Google的量级来说非常复杂，此次跟大家分享下Google内部如何实现服务发现和负载均衡。

经典的服务发现与负载均衡

image

静态的服务发现方式其实很好理解，即基于IP地址和端口做服务发现，应用绑定了服务器的IP地址和端口后，当有请求时，应用就可以接收。

经典的负载均衡器也是绑定某个特定的IP地址和端口，同时负载均衡器将需要做负载均衡的应用实例预先配置好，当负载均衡器收到请求后即可分发给后台的应用实例。

用IP+端口的方式做服务发现对人不友好，因为IP地址不好记忆，所以人们又发明了DNS作为非常经典的服务发现方式。

DNS实现的是域名解析，比较常用的方式是A记录向：DNS查询某个域名的A纪录会返回该域名对应的一个或多个IP地址，图上图所示，给定一个域名，通过查询DNS服务器返回来这个域名所对应的IP地址。

另外一种DNS解析方式是SRV记录，这是DNS里实现更高级服务发现的一种方式，向DNS查询某个域名的SRV记录要返回该域名对应的一个或多哥地址及端口，如上图所示，向DNS查询一个域名地址，DNS返回了该域名对应的一系列地址和端口。

image

DNS除了具有服务发现功能，也可以实现负载均衡，如上图所示，DNS可以根据用户请求，动态的返回某域名的A纪录，如，DNS返回的A纪录是目前最不繁忙的实例IP地址，这样DNS就可以实现负载均衡的功能。

image

静态环境下的负载均衡是最常见的负载均衡器使用场景，如上图所示，用户的请求发给负载均衡器，其根据一定的策略，如轮转策略或暗转一定的权重把收到的请求分发给后面具体的应用实例，应用实例在处理完请求后把响应返回给负载均衡器，之后负载均衡器再把请求响应返回给最终用户。

image

常见的负载均衡器支持四层和七层协议，具体来说就是TCP协议和HTTP协议。

四层负载均衡器，按照TCP协议来说是实现了一种路由转发——一个TCP请求数据包经过四层负载均衡器时，负载均衡器只修改这个TCP请求数据包的目的地址然后转给后面的应用实例；当负载均衡器收到应用实例返回的TCP响应数据包时，会修改这个TCP响应数据包的目的地址然后返回给用户。

七层负载均衡器和四层负载均衡器的工作原理不一样，当七层负载均衡器收到一个用户的HTTP请求数据包会把该请求包拆掉，然后封装成一个新的HTTP请求数据包传给后面的应用实例；当负载均衡器收到应用实例返回的HTTP响应数据包时，会把HTTP响应数据包拆掉然后重新封装一个新的HTTP响应数据包返回给用户，所以四层和七层负载均衡器的工作原理不同，四层类似于路由转发，七层则是完全重新封装的包。

image

常见的服务发现方式有三种：

第一种是用IP地址+端口或域名+端口的方式做服务发现，比如，“website.com:8080”代表一个应用，“website.com:8081”代表另一个应用，虽然这两个应用的域名相同。这种方式适用于四层和七层协议，即TCP及HTTP协议都可以用。

第二种是子域名的方式，仅适用于七层协议，子域名的方式是指不同的应用可能有共同的根源，但是有不同的子域名，比如http://service1.zone1.website.com和http://service2.zone1.website.com，这两个不同的域名（访问端口都是80），有共同的根域名website.com，但子域名不同，因此七层协议如HTTP协议会通过不同的子域名解析到不同的应用。

第三种是子路径的方式，也仅适用于七层协议，如http://zone1.website.com/service1和http://zone1.website.com/service2，两个路径的域名完全一样，但子路径不同，可以用于区分不同的应用服务。

这三种服务发现方式其实总结下来只有IP地址或者域名+端口同时适用于四层、七层，其他如子域名、子路径的方式只适用于七层服务发现。

动态环境

image

上述都是非常经典的负载均衡、服务发现的基本概念和做法，但当数据中心规模达到一定程度时应用和服务器之间更确切的说应用和具体IP地址+端口之间就不再是静态的绑定关系。

如Google的数据中心大约有200万台服务器，若Google的应用和服务器之间是一一对应的静态绑定关系：即某个应用必须要绑在某一个服务武器上，或者绑定某个服务器的IP地址+端口上，那么对Google来说，每时每刻大概会有几百万到上千万个应用运行在200万台服务器中，静态管理应用和服务器非常复杂，因此对于Google这样庞大规模的数据中心来说，必须用动态管理，即要求应用不能以静态绑定在服务器的IP地址+端口上，它可以在不同的服务器之间动态迁移来实现故障自愈，应用运行在某一个服务器上，这个服务器宕机或有问题，会被自动迁移到别的服务器上回复运行，动态的应用调度管理方式可以使应用的管理即服务器的管理进行解耦——应用和服务器之间不再是静态的绑定关系。

image

动态环境下如何做负载均衡和服务发现？首先要明确问题，动态环境最根本的一点是要把服务发现实现，客户端要找到服务的后台，它从哪里找？这就是服务发现，在动态的环境下其实并不复杂，每个服务的后台实例绑定的IP地址和端口注册侧到一个服务注册中心，注册的方式可以是被动注册也可以是主动注册，被动注册是指负责应用调度的调度器来完成应用实例的IP地址+端口注册；主动注册是指每一个服务的实例要主动地上报自己目前所绑定的IP地址+端口。

image

有了动态服务注册机制后，动态环境下的负载均衡也就好实现了，在动态环境下，当负载均衡器收到一个请求后，会去服务注册中心进行查询响应的应用实例地址，然后把请求路由到该应用的后台实例上。

实例：数人云Swan

image

Google内部的服务发现和负载均衡外面看不到，数人云借鉴Google的理念实现了Swan（Github地址：https://github.com/Dataman-Cloud/swan ），Swan基于Mesos来做容器化应用的动态调度，同时Swan实现了DNS和Proxy支持服务发现和负载均衡，跟Google的方式几乎一模一样，因此后面用Swan作例子给大家分享下Google怎么做服务发现和负载均衡。

首先，如何给应用命名，在动态的应用调度和运行的环境下非常重要，因为经典的应用发现偶读是按照IP和端口，没有对应用有统一的命名，但Google对于每个应用、实例都会有相应的命名，要明确几个概念：

一个实例，是应用的某个Task，运行在一个容器里，应用会包含多个Task，都是运行同样的二进制程序；
一个应用，是一组运行同样二进制程序的实例集合，每个实例是这个应用的某个Task；
一组服务可以是一组应用程序；
一个服务会由一个用户在某个集群上发起运行。

Swan给每个实例用五个标签去命名，task-app-service-user-cluster ，Task是从0开始的连续整数，用于标识不同实例；相应地Swan给每个应用四个标签来命名，app-service-user-cluster；进而，Swan给每个服务用是三个标签来命名，service-user-cluster。

Swan实现了DNS用于服务发现，即Swan DNS把Swan调度的每一个实例所绑定的IP地址+端口的信息都记录下来，或是A记录或是SRV记录。

对于每个应用，Swan的DNS也生成一个相应的域名用于四层服务发现，即app.service.user.cluster.swan.com 。另外七层的应用SwanProx会解析应用的另外一个域名http://app.service.user.cluster.gateway.swan.com ，用于七层应用的服务发现和负载均衡。

image

上图是Swan架构的示意图，简单解释了Swan、DNS、Proxy之间的关系：如何通过Swan对应用动态调度后实现服务发现和负载均衡，举例说明：首先，Swan发布一个应用app-app-service-user-cluster ，包含三个实例分别是：0-app-service-user-cluster，1-app-service-user-cluster，2-app-service-user-cluster；当Swan把三个实例都运行起来后，会将三个实例目前运行时所绑定的IP+端口信息提交给Swan DNS。

比如可以访问Swan DNS去解析app.service.user.cluster.swan.com这个域名，会解析出来三个容器的实例；当用户的请求访问app.service.user.cluster.gateway.swan.com，该请求会送达到Swan Proxy上，因为Swan Proxy地址是gateway.swan.com ，Swan Proxy采用子域名的方式解析app.service.user.cluster，在解析此地址时会查Swan DNS，查此应用所对应的实例，每个实例分别在哪个IP+端口上，Swan Proxy查询了Swan DNS后，发现它后面有三个实例，分别在不同的IP和端口上，当Swan Proxy收到对这个应用请求时回分别往后面三个实例上进行分发。

image

上图详细地解析了Swan DNS如何做服务发现，展示了Swan DNS里面的A纪录，图里对应的A纪录是nginx-demo.default.xcm.beijing.swan.com应用，应用名称为nginx-demo，属于default服务，用户为是：xcm，default 服务目前运行在beijing数据中心中，swan.com作为一个后缀去表示是Swan的内网域名，A纪录展现出应用有6个实例，都在192.168.1.196的IP地址上。

image

上图是Swan DNS的SRV记录，SRV记录和A记录不同之处是A记录只返回域名的IP地址，SRV记录要返回域名的IP地址+端口。上图所示的SRV查询结果包含了6个不同的应用实例，分别在不同的端口上，6个不同的实例又在同一个IP地址上：192.168.1.196，但它们绑定的端口不一样：31000、31001、301002、301003、301004、301005、31006。

image

Swan实现了Proxy用于负载均衡。

七层负载均衡：通过Swan Proxy支持子域名方式实现前面提到，用户的HTTP请求发往app.service.user.cluster.gateway.swan.com这个域名地址时，先是.gateway.swan.com解析到Swan Proxy的IP地址上，然后因为Swan Proxy针对HTTP协议做解析的时候它会解析HTTP协议里面的域名，这个域名的子域名就是app.service.user.cluster，也就是这个域名里面的前缀。按照这个前缀，Swan Proxy可以区分出该HTTP请求是要访问哪个具体的应用。Swan Proxy在做HTTP这个服务发现负载均衡的时候会支持会话保持，也会支持HTTPS。

但是Swan Proxy不支持HTTP子路径方式，因为子路径的方式本质上讲不是一种负载均衡的方式，子路径其实和应用所提供的不同服务相关的，所以具体的子路径服务的注册方式需要用额外的，比如微服务自身的服务发现支持，比如SpringCloud里面的Eurake或者阿里的Dubbo这些服务注册中心来做子路径方式的服务注册。

四层负载均衡：因为四层协议，比如TCP协议，的特殊性，Swan Proxy支持的TCP协议只能是端口方式，根据一个Swan Proxy的IP或者Swan Proxy的域名，加上不同的端口来区分不同的应用。Swan Proxy在对TCP进行负载均衡的时候也会支持会话保持。

image

最后汇总下Swan的服务发现、负载均衡方式。结合容器目前的几种网络模式：Bridge方式、Host方式还有固定IP的方式，上图给出Swan在不同容器的网络模式下如何做服务发现、负载均衡。

王璞本次分享介绍了经典的四层、七层负载均衡以及服务发现的三种方式，又以Google数据中心入手，讲述了大体量动态环境的负载均衡及服务发现方式，最后以数人云Swan为例，进行了详细讲解，小数希望大家看后有所收获。

最后编辑于：2017.12.10 07:39:00

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 203,362评论 5赞 477
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 85,330评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 150,247评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,560评论 1赞 273
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,580评论 5赞 365
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,569评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 37,929评论 3赞 395
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,587评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 40,840评论 1赞 297
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,596评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,678评论 1赞 329
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,366评论 4赞 318
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 38,945评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,929评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,165评论 1赞 259
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 43,271评论 2赞 349
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,403评论 2赞 342

关于负载均衡和服务发现，Google的经验在这里

经典的服务发现与负载均衡

动态环境

实例：数人云Swan

推荐阅读更多精彩内容