模式的定义:每一个模式描述了一个在我们周围不断重复发生的问题及该问题的解决方案的核心。这样就能一次又一次地使用该方案而不必要做重复工作。
2.1网站架构模式
2.1.1分层
分层是系统在横向维度切分成几个部分,每个部分负责相对单一的职责,通过上层对下层的依赖和调用组成一个完整的系统。
分层是逻辑上的,在物理部署上三层结构可部署在同一个物理机器上,也可以分别部署在不同服务器。分层结构对网站支持高并发向分布式方向发展至关重要,网站规模很小时就应该采用分层结构。
2.1.2分割
分割是纵向方面对软件进行切分,将不同的功能和服务分割开,包装成高内聚低耦合的模块单元,有利于开发和维护也便于模块的分布式部署。
2.1.3分布式
分层和分割的一个主要目的是为了切分后的模块便于分布式部署。
常用的分布式方案如下几种:
分布式应用和服务:将分层和分割后的应用和服务模块分布式部署。
分布式静态资源:网站的静态资源如JS,CSS,Logo图片等资源独立分布式部署,并采用独立域名,即动静分离。
分布式数据和存储:大型网站要处理P级数据,需要分布式存储,除了对传统的关系数据库进行分布式,为网站应用而生的各种NoSQL产品几乎都是分布式
分布式计算:网站普遍使用Hadoop及其MapReduce分布式计算框架进行处理计算,特点是移动计算而不是移动数据,将计算程序分发到数据所在地以加速计算和分布方式
此外还有支持网站线上服务器配置实时更新的分布式配置;分布式环境下实现并发和协同的分布式锁;支持云存储的分布式文件系统等
2.1.4集群
使用分布式虽然已经将分层好分割后的模块独立部署,但是对于用户访问集中模块还需要独立部署的服务器集群化,即多台服务器部署相同应用构成一个集群,通过负载均衡设备共同对外提供服务。
服务器集群有更多服务器提供相同性能,可以提供更好的并发性,可灵活添加新机器应付更多的用户访问。某台服务器故障时,负载均衡设备的失效转移机制将请求转发到集群的其他服务器上,避免影响用户。
2.1.5缓存
缓存是将数据存放在距离计算最近的位置以加快处理速度。缓存是改善软件性能的第一手段,CPU越来越快的一个重要因素就是使用了更多缓存。
CSN:内容分发网络,部署在离用户最近的网络服务商,用户的网络请求先到他那里,这里缓存网站的一些静态资源,就可以最快速度返回给用户。
反向代理:属于网站前端构架的一部分,部署在网站前端,用户请求到达网站的数据中心时,最先访问反向代理服务器,这里缓存网站的静态资源,无需将请求继续转发给应用服务器就能返回给用户。
本地缓存:在应用服务器本地缓存着热点数据,应用程序可以在本机内存中直接访问数据
分布式缓存:数据缓存在一个专门的分布式缓存集群中,应用程序通过网络通信访问缓存数据
2.1.6异步
大型网站架构中,系统解耦的手段除了分层、分割、分布,还一个重要手段是异步,业务之间的消息传递不是同步调用,而是将一个业务操作分成多个阶段,每个阶段之间通过共享数据的方式异步执行。
异步消息队列的特征:提高系统可用性、加快网站响应速度、消除并发访问高峰
2.1.7冗余
为保证服务器宕机时网站依旧可以服务,不丢失数据,就需要一定程度的服务器冗余运行,数据冗余备份,当某台服务器宕机时,可将其服务和数据访问转移到其他机器。
多个服务器构成集群就是通过冗余实现服务高可用。数据库处理定期备份,存档保存,实现冷备份以外,为保证在线业务高可用,还需要对数据库进行主从分离,实现热备份。
2.1.8自动化
发布过程自动化:自动化代码管理->自动化测试->自动化安全检查->自动化部署->自动化监控->自动化报警->自动化失效转移->自动化失效恢复->自动化降级->自动化分配资源
2.1.9安全
密码和手机校验码进行身份认证;网络通信加密;用户信息加密;验证码识别防止机器人滥用网络资源攻击网站;XSS攻击、SQL注入、进行编码转换等处理;过滤垃圾、敏感信息
2.2架构模式在新浪微博的应用
最初从简单的LAMP(Linux+Apache+MySQL+PHP)架构,支持初期的新浪微博,程序用PHP开发数据存储在MySQL中。
重构后系统分三个层次,最下层是基础服务层,提供数据库、缓存、存储、搜索等数据服务,以及其他基础技术服务。这些服务支持海量数据和高并发访问,是系统的技术基础。
中间层是平台服务和应用服务层,核心服务是微博、关系、用户,这些服务被分割成独立的服务模块,通过依赖调用和共享基础数据构成业务基础。
最上层是API和业务层,各种客户端和第三方应用,通过调用API集成到系统中,组成生态系统。