影响网络传输的因素和基本概念
数据从一个地方到另一个地方再返回来要的时间称为响应时间
网络带宽:就是一条物理链路中1s传输数据数,其实就是我们经常所谓测网速的那个指标,比如1Mb/s,你已经超过了全国86%的用户的那种哈哈。
传输距离: 就是数据走的距离。虽然数据移动很快,但是由于光纤的折射率什么的,长距离的传输不可避免的出现一定的传输延时
TCP拥塞控制:就是动态控制传输的数据量?
发送方维持一个叫做拥塞窗口cwnd(congestion window)的状态变量。拥塞窗口的大小取决于网络的拥塞程度,并且动态地在变化。发送方让自己的发送窗口等于拥塞窗口,另外考虑到接受方的接收能力,发送窗口可能小于拥塞窗口。
Socket:这个其实是一个抽象的概念,具体来说其实就是一种两个主机之间的通信连接,有多种具体实现方式,比如使用TCP-IP套接字。
建立socket连接
客户端建立Socket实例,然后将其与服务器中的ServerSocket实例对应形成连接
数据传输: 我们进行数据传输其实要解决两个问题,硬件的I/O和网络的I/O。实际上我们从键盘输入的数据不是直接进行网络I/O,而是通过一个缓存区进行缓存,同时从网络中获得的数据也是放在缓存区中。倘若A和B通信,B向A发信息,B会向输出缓冲区写信息,倘若这个输出缓冲区满了,这时候信息就会传递到A的读取缓冲区,倘若A的读取缓冲区和B的输出缓冲区都满了,这时候就会停止B的输出操作。这就造成write的阻塞。
BIO 阻塞IO: 不管网络还是磁盘IO数据写入或者数据读取时都可能发生堵塞,一旦阻塞线程将会失去CPU使用权,这是在大规模访问中无法接受的事情,多线程和线程池能减轻阻塞造成的影响(因为阻塞只是阻塞一个线程,一般就是影响一个对话而已)和减少线程的创建消耗。但是对于长连接的情况是没法创建这么多线程的,而且无法实现服务优先级的问题,而且多线程导致的资源同步问题也是很复杂的。
所以采用新的IO方式 NIO
NIO网络工作机制
NIO有三个核心一个是通道Channel一个是选择器Selector还有一个缓存区Buffer,通道其实就是一个socket的实现代表着客户端和服务器的一个通信连接,而这个NIO的核心是传输的数据可以一段一段传输,服务器的不会停止工作或者开一个线程专门等待信息传输完成,服务器将这个监听数据的任务交给选择器(只是用一个线程),当数据传输完毕后选择器会将这些数据分配到各自相应的Buffer中,没错Buffer就是个存放数据的缓存区而已。
网络IO优化
减少网络交互的次数
1.比如提供对SQL查询结果的缓存
2.合并访问请求,比如申请很多CSS文件可以一并向服务器请求,然后服务器一个个返回文件减少网络传输数据的大小
1.数据压缩
2.设计简单的协议,尽量从协议头获得有用的信息减少编码,尽量提前将字符转化为字节,或减少字符变字节的转化
交互策略
同步和异步,针对任务序列,同步是任务相互依存,这个任务不成功则下一个任务失败。异步则任务相互独立,这个任务成功不能说明上个任务成功。同步追求可靠性,异步追求性能
阻塞和非阻塞,阻塞是CPU等待IO完成,异步则CPU做其他事等IO完成后才回来,异步看起来对CPU利用率更高,但实际上要考虑线程的花费和程序的复杂度的提高所带来的成本
- 同步阻塞:简单,性能差
- 同步非阻塞:对IO长连接且输送数据不多很好
- 异步阻塞:常用于数据库的备份
- 异步非阻塞:只用于一些非常复杂的分布式,对数据传输不大但频繁性能提高最高