汇编(一) -- 初识汇编

前言

最近准备学习汇编,然后在B站上看到叫iOS小贤的作者发的视频挺不错,打算跟着学,文章是看视频的笔记,最后有原视频链接,想看视频的可以看看通过链接查看视频。

机器语言

  • 由0和1组成的机器指令.
  • 如: 0101 0001 1101 0110

注:机器指令最终转换成电信号。

汇编语言(assembly language)

  • 使用符号代替机器语言,也称为符号语言
  • 如: mov ax,bx

高级语言

  • C\C++\Java\OC\Swift,更加接近人类的自然语言
  • 如:int a = b

我们的代码在终端设备上是这样的过程:

2990730-42c0522b35289061.png

注:高级语言根据不同的平台编译成对应的汇编语言,汇编语言在编译成机器语言,最终执行的是机器语言,axbx是寄存器,mov ax, bx是将ax寄存器的值放入bx中,mov ax, bx在CPU底层就是1000100111011000,在做逆向开发过程中有个概念叫反汇编,安装到手机上是加密或者加壳的机器语言,通过工具可以砸壳,砸壳之后就能得到机器语言,然后可以反汇编成汇编语言(因为一条汇编指令和一条机器指令是一一对应的),但是汇编语言不能反编译成高级语言,因为不同平台下有不同的汇编指令,所以同一条C/OC语言会可能生成不同的汇编代码,也有可能会生成同样的汇编代码。

高级语言是在汇编语言之上的,做了一层包装,所以我们看到的汇编语言有很多代码是用来配置一些环境的,来支持高级语言的一些语法特性,比如面向对象的特性。

  • 汇编语言与机器语言一一对应,每一条机器指令都有与之对应的汇编指令
  • 汇编语言可以通过编译得到机器语言,机器语言可以通过反汇编得到汇编语言
  • 高级语言可以通过编译得到汇编语言\ 机器语言,但汇编语言\机器语言几乎不可能还原成高级语言

汇编语言的特点

  • 可以直接访问、控制各种硬件设备,比如存储器、CPU等,能最大限度地发挥硬件的功能
  • 能够不受编译器的限制,对生成的二进制代码进行完全的控制
  • 目标代码简短,占用内存少,执行速度快
  • 汇编指令是机器指令的助记符,同机器指令一一对应。每一款型号的CPU都有自己的机器指令集\汇编指令集,所以汇编语言不具备可移植性
  • 知识点过多,开发者需要对CPU等硬件结构有所了解,不易于编写、调试、维护
  • 不区分大小写,比如mov和MOV是一样的

注:汇编可以直接访问CPU,寄存器属于CPU的,可以最大限度发挥硬件的功能,而且不受编译器的限制。比如用汇编写一些病毒或者做安全相关的东西,为什么能做这些事情呢?因为用高级语言做一些开发的时候,有很多功能是受限制的,但是由于汇编是直接访问CPU的,因为操作系统也是指令集,操作系统能做的事情我们也能做。“执行速度快”是相对高级语言,一条高级语言代码生成的汇编语言可能会非常多,因为高级语言要搭一个环境,比如面向对象的语言特性,用很多汇编指令才能支撑,所以直接写汇编语言“目标代码简短,占用内存少,执行速度快”。再说一下“标代码简短,占用内存少”,我们所写的代码在执行的过程中需要加载进内存,叫装载的过程,高级语言可能你写的代码很少,但生成的汇编很多,所以占用的内存就会大。而且高级语言最终转变的二进制,因为要环境搭建,要绕很多弯,链接很多库,比方说NSLog,需要链接很多系统的库,所以最终生成的二进制有很多二进制的东西,所以最终转成的机器码比较大。

汇编的用途

  • 编写驱动程序、操作系统(比如Linux内核的某些关键部分)
  • 对性能要求极高的程序或者代码片段,可与高级语言混合使用(内联汇编)
  • 软件安全
    • 病毒分析与防治
    • 逆向\加壳\脱壳\破解\外挂\免杀\加密解密\漏洞\黑客
  • 理解整个计算机系统的最佳起点和最有效途径
  • 为编写高效代码打下基础
  • 弄清代码的本质
  • 函数的本质究竟是什么?
    • sizeof
    • ++a + ++a + ++a 底层如何执行的?
    • 编译器到底帮我们干了什么?
    • DEBUG模式和RELEASE模式有什么关键的地方被我们忽略
    • ......

下面来新建一个项目Assembly001,然后在Debug中把Debug Workflow设置成Always Show Disassembly,这样打了断点会显示反汇编代码

Screen Shot 2019-08-03 at 6.49.55 PM.png

执行程序

Screen Shot 2019-08-03 at 6.56.50 PM.png

刚刚看到的是X86汇编,movl %eax, -0x14(%rbp)在LLDB中输入memory read 0x10cc7f795可以得到这条指令所在的地址,这些都是16进制的,0x10cc7f798减去0x10cc7f795为4,也就是在内存中占有4个字节,32位。

0x10cc7f795: 89 45 ec e8 e9 02 00 00 8b 7d f8 48 8b 75 f0 48  .E.......}.H.u.H 
0x10cc7f7a5: 8b 0d cd 24 00 00 48 8b 15 be 24 00 00 89 7d e8  ...$..H...$...}.

输入memory read 0x10cc7f79548 83 ec 30这4个字节就是subq $0x30, %rsp这个指令的意思。

0x10cc7f774: 48 83 ec 30 c7 45 fc 00 00 00 00 89 7d f8 48 89  H..0.E......}.H.
0x10cc7f784: 75 f0 bf 01 00 00 00 be 02 00 00 00 e8 bb ff ff  u...............

再输入s挑战到test

Screen Shot 2019-08-03 at 6.57.30 PM.png

汇编语言的种类

  • 目前讨论比较多的汇编语言有

    • 8086汇编(8086处理器是16bit的CPU)
    • Win32汇编
    • Win64汇编
    • ARM汇编(嵌入式、Mac、iOS)
    • ......
  • 我们iPhone里面用到的是ARM汇编,但是不同的设备也有差异.因CPU的架构不同.

架构 设备
armv6 iPhone, iPhone2, iPhone3G, 第一代、第二代 iPod Touch
armv7 iPhone3GS, iPhone4, iPhone4S,iPad, iPad2, iPad3(The New iPad), iPad mini, iPod Touch 3G, iPod Touch4
armv7s iPhone5, iPhone5C, iPad4(iPad with Retina Display)
arm64 iPhone6s, iphone6s plus, iPhone6, iPhone6 plus, iPhone5S, iPad Air, iPad mini2
  • 因为学习所以建议先从最为经典的8086开始

    • 结构简洁,容易理解
    • 指令简单,便于记忆
    • 原理相通
    2990730-f24b481bdcb65228.png

注:手机安装的App中有很多文件,Mach-O是可执行文件,可执行文件需要装载进内存。本地图片,bundle, nib文件不属于执行文件,属于数据,也需要加载进内存,只不过在使用的时候才加载,但是执行文件首先加载进内存。加载进内存后,CUP通过地址总线读指令,读到对应指令之后会通过控制总线控制终端设备的屏幕每个像素点是RGBA,每个值是0到255,255的二进制是1111 1111,8个二进制位,也就是一个字节,内存中最小单元是一个字节。

  • 硬件相关最为重要是CPU/内存
  • 在汇编中,大部分指令都是和CPU与内存相关的

参考:

底层原理(反编译)--初识汇编

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,126评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,254评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,445评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,185评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,178评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,970评论 1 284
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,276评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,927评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,400评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,883评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,997评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,646评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,213评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,204评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,423评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,423评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,722评论 2 345

推荐阅读更多精彩内容

  • 编程语言的发展 机器语言由0和1组成 汇编语言(Assembly Language)用符号代替了0和1,比机器语言...
    阿凡提说AI阅读 3,977评论 0 15
  • 汇编总结 汇编的发展史 机械语言 由0和1组成的机器指令(如:0101 0001 1101 0110) 汇编语言(...
    iChuck阅读 1,299评论 1 8
  • 编程语言的发展 机器语言: 由 0 和 1 组成. 汇编语言(Assembly Language): 用符号代替了...
    Lin__Chuan阅读 3,708评论 2 7
  • 王爽汇编全书知识点大纲 第一章 基础知识 机器语言 汇编语言的产生 汇编语言的组成 存储器 cpu对存储器的读写 ...
    2c3ba901516f阅读 2,407评论 0 1
  • 越底层越单纯!真正的程序员都需要了解的一门非常重要的语言,汇编! 机器语言 我们所写的语言最终安装在机器上的是什么...
    瑞阳gg阅读 583评论 0 0