android dalvik浅析一：解释器及其执行

所谓模块化代码生成方法，就是说将解释器的实现划分成若干个模块，每一个模块都对应有一系列的输入文件（本身也是源代码文件），最后通过工具（一个Python脚本）将这些输入文件组装起来形成一个C语言文件或者汇编语言文件。这个最终得到的C语言文件或者汇编语言文件就是Dalvik虚拟机的解释器的实现文件。有了这种模块化代码生成方法之后，为某一个特定的平台生成优化过的解释器就是相当容易的：我们只需要为该平台的Dalvik虚拟机解释器的相关模块提供一个特殊版本的输入文件即可。也就是说，我们需要为每一个支持的平台提供一个配置文件，该配置文件描述了该平台的Dalvik虚拟机解释器的各个模块所要使用的输入文件。这种模块化代码生成方法不仅能避免手动编写解释器容易出错的问题，还能方便快速地将Dalvik虚拟机从一个平台移植到另外一个平台。 --by 老罗

ok，既然这个gen-mterp.py能帮我们自动生成解释器。那我们就去一探究竟吧～(￣▽￣～)(～￣▽￣)～

# ===========================================================================# "main" code

# Check args.iflen(sys.argv) !=3:

print "Usage: %s target-arch output-dir"% sys.argv[0]

sys.exit(2)

# target-arch要生成的模式：portable fast

target_arch = sys.argv[1]

# output-dir输出目录

output_dir = sys.argv[2]

# Extract opcode list.

# 提取dexopcode列表

opcodes = getOpcodeList()

# Open config file.

# 打开配置文件sys.ary[1]

......

# Open and prepare output files.

# 打开输出文件sys.ary[2]/InterpC-sys.ary[1].cpp sys.ary[2]/InterpC-sys.ary[1].stry:

c_fp = open("%s/InterpC-%s.cpp"% (output_dir, target_arch),"w")

asm_fp = open("%s/InterpAsm-%s.S"% (output_dir, target_arch),"w")

except:

print "Unable to open output files" print "Make sure directory '%s' exists and existing files are writable" \

% output_dir

# Ideally we'd remove the files to avoid confusing "make", but if they# failed to open we probably won't be able to remove them either.sys.exit(1)

......

file_header ="""/** This file was generated automatically by gen-mterp.pyfor'%s'.

* * --> DO NOT EDIT <-- */""" % (target_arch)c_fp.write(file_header)

asm_fp.write(file_header)

上面这么一大段代码究竟是干什么的呢，其实就做了2件事：

1 在out文件夹下创建arch对应的cpp和asm解释器代码(以InterpC-armv7-a为例(以下涉及到config不再重复)，会在out下创建InterpC-armv7-a.cpp和InterpAsm-armv7-a.S；看到最后的一大串字符了，你打开out下每个文件都包含)；

2 打开对应的arch配置(就是上面的一大段config-xxx文本)，后面的代码就是解析这个配置文件；

3 打开/dalvik/libdex/DexOpcodes.h 头文件，将 DEFINE_GOTO_TABLE(指令字符串)提取组成键值对(根据指令字符可到序列号)中，这个在后面构成汇编解释器时会用到

再来看gen-mterp.py下相关的代码

# Process the config file.# 处理配置文件failed = Falsetry:# 逐行读取配置文件内容forlinein config_fp:

line = line.strip()# remove CRLF, leading spacestokens = line.split('')# tokenize#print "%d: %s" % (len(tokens), tokens)iflen(tokens[0]) == 0:

#print " blank"passeliftokens[0][0] =='#':

#print " comment"passelse:# 不分析空行和注释行，解析代码行iftokens[0] =="handler-size":# Set handler_size_bytes，二进制位数 setHandlerSize(tokens)

eliftokens[0] =="import":# 将import文件copy到输出文本:c_fp或asm_fp importFile(tokens)

eliftokens[0] =="asm-stub":# copy asm-stub文本到asm-stub-txt setAsmStub(tokens)

eliftokens[0] =="asm-alt-stub":# Record location of default alt stub setAsmAltStub(tokens)

eliftokens[0] =="op-start":# in_op_start = 1 且设置default_op_dir = op-start opStart(tokens)

......

eliftokens[0] =="op":# 设置opcode指令的文件地址组成键值对 opEntry(tokens)

eliftokens[0] =="handler-style":# Set interpreter style setHandlerStyle(tokens)

......

上面的for ...in...语句就是在逐行解析config文本，我们只挑选重要解释：

handler-style：设置解释器的类型

handler-size：提到这个是因为在它需要跟 handler-style相关联，必须先设置style的值，这就关系到config文本的编写：

handler-style computed-goto

handler-size 64 先handler-style后handler-size

import：直接将import的cpp和s文本写入到InterpC-armv7-a.cpp(对于cpp来说这就是全部的工作)和InterpAsm-armv7-a.S

op-start：开始填写指令解释符，主要是设置in_op_start = 1，供下面OP 判断状态使用

op：根据文本设置对应的opcode_locations值：op OP_ADD_DOUBLE_2ADDR armv6t2-->opcode_locations[OP_ADD_DOUBLE_2ADDR] = armv6t2 ,存储的是opcode的解释代码的文件目录，不理解看下面

op-end:首先opcodes[index]去除opcode，然后opcode_locations[opcode]得到opcode的解释代码的文件目录Dstr，最后利用Dstr/opcode.s得到具体opcode解释代码的asm文本并将其写入InterpAsm-armv7-a.S。

对于op-start,op,op-end举例说明：op OP_MOVE armv6t2——>op指令解析“op_mov”指令文件夹为"armv6t2",构成对应的指令解释文本为armv6t2/op_mov.s

　最后提几点：

　本篇讲解的是dalvik解释器部分，而解释器的工作是把java代码翻译机器码。在dalvik虚拟机中执行函数由CallStaticVoidMethod来执行，但最终是通过dvmCallMethodV(请重点关注它，很重要哎；xposed框架就是基于此来实现的)：

voiddvmCallMethodV(Thread* self,constMethod* method, Object* obj,

boolfromJni, JValue* pResult, va_list args)

{

......

if(dvmIsNativeMethod(method)) { TRACE_METHOD_ENTER(self, method);/* * Because we leave no space for local variables, "curFrame" points

* directly at the method arguments.

*/ (*method->nativeFunc)(self->curFrame, pResult, method, self);

TRACE_METHOD_EXIT(self, method);

} else {

dvmInterpret(self, method, pResult);

}

......

}

看上面红色代码，先判断method是否为native，是则执行其curFrame(其实是native code)；否则去执行dvmInterpret。dvmInterpret是解释器入口，在interp.cpp文件中，会根据指令来调用上面编译生成的解释代码。

参考资料：

1生成dalvik解释器原文件的脚本：gen-mterp.py

2老罗android之旅

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,311评论 6赞 481
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,339评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 152,671评论 0赞 342
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,252评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,253评论 5赞 371
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,031评论 1赞 285
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,340评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,973评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,466评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,937评论 2赞 323
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,039评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,701评论 4赞 323
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,254评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,259评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,485评论 1赞 262
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,497评论 2赞 354
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,786评论 2赞 345

android dalvik浅析一：解释器及其执行

推荐阅读更多精彩内容