秒杀系统架构原则 “四要一不要”
秒杀系统的本质是满足高并发、高性能和高可用的分布式系统。秒杀系统的架构原则总结为四要一不要。
数据尽量少
数据量尽量少的原则是指上传给服务器和返回给用户的数据要足够小,因为不管请求数据还是返回数据都需要网络传输并且经过服务器压缩和字符编码,这些操作都很消耗cpu。
数据尽量小要求依赖的数据尽可能小,包括完成逻辑需要读取和存储的数据。调用其他服务涉及数据的序列化和反序列化,其中数据库也会成为瓶颈。
请求数尽量少
网页元素资源的加载都需要socket请求获取数据,合并css、JavaScript等能有效较少请求数。
路径要尽量短
路径是指从请求到返回给用户中间经历的节点数,可以是一个系统或者一个新的socket请求。每增加一个路径都会增加不确定性,减少路径可以增加可用性、提升性能(减少序列化和反序列化)、减少延时(网络数据传输)。
把多个远程过程调用rpc合并在一台机器部署,将rpc调用编程jvm内部系统调用。
依赖尽量少
依赖是指完成一次用户请求必须依赖的服务或系统。0级系统尽量减少对1级系统的依赖,防止重要系统被不重要系统拖垮。
不要有单点
分布式系统重要架构原则就是 消除单点。避免单点的方法就是将服务无状态化,把服务状态和服务器解耦。
动静分离方案
数据的动静分离,总结起来就是提高单次请求效率,减少没必要的额请求。动静数据区分是否含有于用户相关的数据。
缓存静态数据
- 缓存在离用户最近的地方 常见的缓存方式是浏览器、CDN、服务器cache中。
- 缓存用户http链接 静态改造就是直接缓存用户的http链接而不只是缓存数据,例如web服务器根据用户请求链接,直接从缓存中获取http响应信息返回给用户。
- 在那层做缓存 例如使用web服务器(nginx、Apache)等直接缓存静态文件,可以屏蔽java层对大量链接的处理。
动静分离改造
- URL唯一化 可以将唯一化的URL作为key缓存
- 分离浏览者相关信息 浏览者相关的信息通过异步方式获取
- 分离时间因素
- 异步地域化信息
- 去掉cookie 缓存中不应该包含cookie等用户相关信息
动静分离的方案
- 实体单机部署方案 单机部署没有网络瓶颈,提升命中率减少gzip压缩
- 统一cache层 单独抽离cache层,便于维护管理和监控。cache层内部交换网络成为瓶颈
- 上CDN
热点数据处理
秒杀商品在很短时间内被查询和访问。热点请求会占用服务器大量资源,热点请求对应的数据就是热点数据,热点数据区分静态热点数据和静态热点数据。
发现静态热点数据
可以通过商业手段发现静态热点数据,例如让商户提前报名参加秒杀活动,得到静态热点数据。该方案实时性比较差。
发现动态热点数据
- 构建热点收集异步系统,收集交易链路中的各个环节热点key,例如nginx、rpc、中间件等。
- 建立一个热点上报和按需订阅热点服务的下发规范,把上游动态发现的热点数据下发到下游系统。
- 上游系统收集的热点数据下发给下游系统,下游系统提前做好热点保护。
热点数据处理
对于热点数据的处理包括,优化、限制、隔离。
- 优化:缓存热点数据,做好动静热点数据分离;缓存采用lru淘汰策略替换热点数据
- 限制:防止热点数据占用太多服务器资源,而其他请求得不到处理。将请求根据商品id做分桶处理。
- 隔离:将热点数据隔离出来,不要让1%的请求影响另外99%的请求。业务隔离(提前报名和热点预热);系统隔离(申请不同的域名和单独部署);数据隔离(单独的cache层和mysql存放热点数据)。
流量消峰如何处理
服务器的处理能力是恒定的,当秒杀出现流量峰值时 很容易导致服务处理不过来。消峰的存在是可以让服务器更加平滑的运行。
队列排队
把同步的请求转换为异步请求,通过队列接受流量洪峰,服务端平滑的处理队列里的请求信息。
延时请求
将请求拉长,大道延时请求的目的。增加验证逻辑并且需要防止机器验证等。
分层过滤
分层过滤的主要思想就是,层层过滤掉无效的请求 让漏斗的末端才是有效数据。
- 将动态数据缓存在前端web 缓存中,过滤掉无效的读数据
- 对读的数据不做强一致性验证
- 对写数据做限流保护,丢弃超过负荷的请求
- 对写数据做强一致性验证