笔记
软件系统中高性能带来的复杂度主要体现在两方面,一方面是单台计算机内部为了高性能带来的复杂度;另一方面是多台计算机集群为了高性能带来的复杂度。
操作系统发展到现在,如果我们要完成一个高性能的软件系统,需要考虑如多进程、多线程、进程间通信、多线程并发等技术点,而且这些技术并不是最新的就是最好的,也不是非此即彼的选择。
目前这样的解决方案有 3 种:SMP(Symmetric Multi-Processor,对称多处理器结构)、NUMA(Non-Uniform Memory Access,非一致存储访问结构)、MPP(Massive Parallel Processing,海量并行处理结构)。其中 SMP 是我们最常见的,目前流行的多核处理器就是 SMP 方案。
虽然计算机硬件的性能快速发展,但和业务的发展速度相比,还是小巫见大巫了,尤其是进入互联网时代后,业务的发展速度远远超过了硬件的发展速度。
-
通过大量机器来提升性能,并不仅仅是增加机器这么简单。让多台机器配合起来达到高性能的目的,是一个复杂的任务。常见的几种方式:
- 任务分配。任务分配的意思是指每台机器都可以处理完整的业务任务,不同的任务分配到不同的机器上执行。
- 任务分解。把原来大一统但复杂的业务系统,拆分成小而简单但需要多个系统配合的业务系统
任务分配的意思是指每台机器都可以处理完整的业务任务,不同的任务分配到不同的机器上执行。
-
任务分解提升性能的原因:
- 简单的系统更加容易做到高性能。
- 可以针对单个任务进行扩展。
如果系统拆分得太细,为了完成某个业务,系统间的调用次数会呈指数级别上升,而系统间的调用通道目前都是通过网络传输的方式,性能远比系统内的函数调用要低得多。
最终决定业务处理性能的还是业务逻辑本身,业务逻辑本身没有发生大的变化下,理论上的性能是有一个上限的,系统拆分能够让性能逼近这个极限,但无法突破这个极限。
理解与思考
计算机硬件的发展会给软件系统带来一定的性能提升。但这种提升作用有限,无法支撑人们对软件系统的总体的性能诉求。硬件性能的提升效用会很快被软件系统的新需求所带来的复杂性所吞没。
集群带来的是系统在处理能力和容量上的性能提升。在单个请求的响应时间上,集群不一定会带来更高的性能,毕竟集群内有网络传播损耗,而单机内是内存通信。
集群在业务处理上的两种方式,任务分配和任务分解,其实也对应着两种扩展方式,水平扩展和垂直扩展。
因为性能的原因,我们不得不去调整架构设计,这种调整本身会带来复杂性。我不觉得李老师说的“降低复杂性”能够回答架构设计的目的。大部分时候,我们的设计是带来了复杂性。但如果不做架构设计,我们开发出来的系统又不能满足业务的要求。是不是这样来回答为什么做设计更好:“在有限的资源条件下设计我们的架构,以满足业务在功能、性能、高可用、可扩展性、安全及成本等方面的要求。”
任务分解的方式,是一种细化对资源管理和分配的手法。
做任何事情都有代价。境界的高低在于怎样准确的权衡得失和正确的做取舍。
做优化的时候,先看有没有做错事情,多做事情,或者做无用的事情,再来看做事的效率。如果在不需要的事情上用力做优化,只会无功而返,徒耗精力。
思考题
所在的业务体系中,高性能的系统采用的是哪种方式?目前是否有改进和提升的空间?
我们使用了spark平台来处理数据。