网络方面常常有很多奇特的bug,总是上线后才会触发,线下的各种压力工具都没办法模拟出来。如果能把线上的流量复制到线下测试环境里使用,测试时可以覆盖更多潜在问题点,追查问题时又能完全不影响线上服务,该多好……tcpcopy来做这个事情正好,而且新版的tcpcopy使用起来更简单~~
0. 基本原理说明
总体来说,是把线上流量或保存的离线pcap包里的报文,变换源/目标地址后发给被测试机,被测试机上的服务回复这些报文,默认路由或者匹配修改后源地址的包的路由,全部指向辅助机,辅助机根据报文类型和TCP协议规范,回复相应的报文给被测试机;这样,从被测试机看,自己收到了网络请求并正常回复,完成了C/S的交互处理。
以下是官网原理图:
1. 基本用法实践
1.0 抓取在线流量保存到文件
使用tcpdump工具,可以很方便的抓取和保存流量到pcap文件,如下:
# 基本抓包命令
tcpdump -i [网络设备] -w [存储到的pcap文件]
## 带过滤条件的命令,保存所有80端口的tcp流量
tcpdump -i [网络设备] tcp and port 80 -w [存储到的pcap文件]
## 例如
[root@icymoon.host]# tcpdump -i eth01 tcp and port 80 -w ./dump.pcap
tcpdump: listening on eth01, link-type EN10MB (Ethernet), capture size 262144 bytes
582561 packets captured
591748 packets received by filter
9099 packets dropped by kernel
1.1 环境安装
(1)在回放机上,安装tcpcopy
## 安装依赖库
yum install libpcap libpcap-devel
## 下载源码
git clone https://github.com/session-replay-tools/tcpcopy.git
## 编译安装
cd tcpcopy/
./configure --offline
make
make install
## 安装好的路径在
/usr/local/intercept/sbin/intercept
(2)在辅助机上,安装intercept
## 下载源码
git clone git://github.com/session-replay-tools/intercept.git
## 编译安装
./configure
make
make install
## 安装好的路径在
/usr/local/tcpcopy/sbin/tcpcopy
1.2 配置回放环境
(0)环境说明
注意:辅助机和测试机要在同一个网段哦~~以便测试机默认网关指向辅助机
测试机:12.21.219.22
测试机上的服务地址:12.21.219.22:8080
辅助机:12.21.219.24
回放机:12.21.219.23
(1)在辅助机上,启动intercept
## 启动命令如下,默认监听在36524端口等待tcpcopy来连接:
/usr/local/intercept/sbin/intercept -i [接收测试机响应回放报文的设备] -F [响应报文的过滤规则] -d
## 例如以下命令,启动intercept,从eth02网卡接收源端口为8080的tcp报文并回应
/usr/local/intercept/sbin/intercept -i eth02 -F 'tcp and src port 8080' -d
(2)在回放机上,启动tcpcopy
## 离线回放的启动命令如下:
tcpcopy -l [日志文件路径] -x [pcap文件中要被替换的目的端口]-[pcap文件中要被替换的目的地址:要被替换的目的端口] -s [辅助机地址,] -c [替换成什么源地址范围,] -i [pcap文件]
## 例如以下命令,回放~/mydump.pcap中的流量,改目的端口80的包为源地址12.21.219.x,目的地址12.21.219.22且目的端口8080,日志记录在/var/log/tcpcopy.log
/usr/local/tcpcopy/sbin/tcpcopy -l /var/log/tcpcopy.log -x 80-12.21.219.22:8080 -s 12.21.219.24 -c 12.21.219.x -i ~/mydump.pcap
(3)在测试机上,配置默认路由为辅助机,以保证所有回复回放流量的报文都打到辅助机上,例如:
route add -net 12.21.219.0 netmask 255.255.255.0 gw 12.21.219.24
(4)如果服务器上带iptables过滤规则,记得打开哦,比如辅助机上,我要允许回放机连接36524端口,可以如下配置
iptables -I INPUT -p TCP --dport 36524 -j DROP
iptables -I INPUT -s 12.21.219.23 -p TCP --dport 36524 -j ACCEPT
2. 进阶问题
2.0 高阶参数说明
-O 只回放完整的 tcp 流
-r 只回放百分之多少的流量
-n 放大几倍流量进行回放
2.1 一些场景举例(to be continued)
2.2 tcpcopy的优点和缺点
(1)优点
- 支持离线流量回放,对在线完全无干扰,也方便自动化测试;
- 支持分布式的流量回放,解决测试时压力不足的问题;
- tcp流的过滤功能比较多;
- 支持mysql等应用场景回放;
(2)缺点 - 早期版本存在丢包情况(最新版没有遇到过);
- 多机配置方案比较复杂;
附基本信息
tcpcopy git地址:https://github.com/session-replay-tools/tcpcopy
intercept git地址:https://github.com/session-replay-tools/intercept