为何要避免装箱/拆箱,为何要关闭Debug.Log及IL代码分析查看

C#中,所有的值类型均派生自System.ValueType,而System.ValueType则派生自System.Object

值类型是“轻“量的类型,内存开销上要比引用类型要小,原因是:

1.值类型不在拖管堆上分配
2.没有堆上的每个对象都有的额外成员:”类型对象指针”(type object pointer)和同步块索引(sync block index).
(这里的同步块索引会在GC的时候使用到)

但有的时候,我们需要将值类型转换成引用类型,这个过程就会产生“装箱”(boxing)的转换.

比如下面的代码:

public struct Point {
    public int x;
    public int y;
}

  ArrayList a = new ArrayList ();
        Point point;
        for (int i = 0; i < 10; ++i) {
            point.x = point.y = i;
            a.Add (point);

        }

Add接收的是一个object类型的参数,那么我们传入的是值类型,需要将值类型进行"装箱“,转换成object 类型并添加到ArrayList当中。

在装箱的过程中,都发生了哪些事情?

1.在拖管堆中分配内存,分配的内存量是由值类型的各个字段所需要的内存量决定,还要加上拖管堆中所有对象都有的额外
成员:类型对象指针和同步块索引

以上面Point为例,他有两个int字段,一个int字段是32位,占4个字节,2个int字段,就是8个字节,还有额外的两个成员(类型对象指针和同步块索引)的内存占用,如果是32位应用程序,那么各自需要32位的空间来存储,如果是64位,则各自需要64位的空间来存储,假设是32位应用程序,那么Point需要在堆中分配的内存空间是:

x占4字节+y占4字节+类型对象指针4字节+同步块索引4字节=16字节

当然,实际开发中,都要包含很多的字段,空间也会更大。

2.完成第一步的拖管堆的内存分配以后,第2步就要将值类型字段的值,复制到堆中的对应字段。

3.最后一步,返回对象的地址,现在该地址是对象引用,而不是值类型。

所以,如果我们装箱的操作放在Update中去执行话,就会不断的在拖管堆上分配内存,只要在拖管堆上分配内存就容易引起GC的调用,比如说内存超过第0代的预算时,GC就一定会调用来释放更多的空间。(C#中,GC调用是基于分代技术的,具体可以看我之前写的关于CLR垃圾回收,拖管堆的文章)

上面的例子中,我们直接通过ArrayList 来添加Point,仅是为了演示装箱的过程,实际上,可以使用泛型来避免装箱的操作,
比如:

ArrayList<Point> a = new ArrayList<Point>();

这样在Add时,就不会进行装箱操作了。

上面的装箱操作以后,就得谈谈拆箱(unboxing)了,即从引用类型转换为值类型,从字面上看,装箱和拆箱是相反的过程,但并不是这样,拆箱的性能开销要比装箱低得多。拆箱就是获取指针的过程。

Point p = (Point)a[0];

在拆箱的过程中,都发生了哪些事情?

1.获取已装箱Point对象中,各个字段的地址。

2.将字段包含的值从堆中复制到栈的值类型实例中。

在这个过程,也会有安全检查,如果已装箱值类型的字段为null,则抛出异常,另外,类型不匹配也会抛出异常

拆箱有着严格的限制,原类型和目标类型不一致是不可以进行转换的。

如下代码:

System.Int32 a =  10;
    object o = a;
    System.Int16 b = (System.Int16)o;

运行后会抛出异常:

InvalidCastException: Cannot cast from source type to destination type.

正确的操作是:

System.Int32 a =  10;
    object o = a;
    System.Int16 b = (System.Int16)(System.Int32)o;

先按原类型进行拆箱,再强制转换为short类型。

下面通过一些例子来演示装箱的拆箱的过程,加深理解:

Example 1:

Point p;
    p.x = p.y = 1;
    object o = p;//对P进行装箱,o引用已装箱的实例(装箱三步曲)

    p = (Point)o;//对O拆箱,将字段从已装箱的实例复制到栈变量中

Example 2:

 Point p;
    p.x = p.y = 1;
    object o = p;//对P进行装箱,o引用已装箱的实例(装箱三步曲)

    p = (Point)o;//对O拆箱,将字段从已装箱的实例复制到栈变量中
    p.x = 2;//更改栈变量p中x字段的值
    o = p;//重新对p进行装箱,o引用新的已装箱的实例

Example 3:

 System.Int32 v =5;
    object o = v;
    v = 123;
    Console.WriteLine(v+","+(System.Int32)o);

上述代码发生了多少次装箱?

第1处: object o = v;//v被装箱,o指向堆中的地址

第2处&第3处:Console.WriteLine(v+","+(System.Int32)o);这一句,调用的Console.WriteLine(object,o1,object o2,object o3)的重载版本,所以v要装箱,并将已装箱的v在拖管堆中的地址传给参数o1,","是string引用类型,o2直接指向它,最后(System.Int32)o,是对引用o进行拆箱(但并没有紧跟着复制),这时候(System.Int32)o拆箱成为了值类型,但这个值类型要再一次的进行装箱,因为参数o3也是object类型的。

所以上面的代码一共进行了3次装箱操作,如果上面的输出很频繁,比如在Update中,那会不断的在堆中创建分配内存。会引起GC,所以一定要注意!

上面的代码,写成如下就会变得更加的有效率:

Console.WriteLine(v+","+o);

直接+o引用对象,去掉了一次装箱和拆箱,效率就高多了。

再看下面这种写法,只有一次装箱的操作,进一步提升代码的性能:

Console.WriteLine(v.toString()+","+o);

原因是v是值类型,值类型均继承自System.ValueType,而它又重写了toString()方法,所以toString()方法实际上是不会进行装箱转换的。

那么,如何确定我的代码都有哪些装箱和拆箱操作的地方呢?

.Net官方提供了一个ILDasm.exe工具,可以查看方法的IL代码,观察IL指令box/unbox都在哪些地方出现,并以此进行优化。

比如上面的代码中,我们通过ILDasm.exe工具进行查看如下:

先看Console.WriteLine(v+","+(System.Int32)o);这种情况:

(如果你是使用Unity测试的话,修改脚本后,Unity会生成程序集Assembly-CSharp.dll,位置在:工程目vi 录\Library\ScriptAssemblies\下,注意,每次重新生成时,要关闭ILDasm.exe,否则引用中,会生成失败)

image.png

将Assembly-CSharp.dll拖进工具里以后,会显示这样的树形结构,这是我当前类的目录结构,画圈的地方是
我当前运行的类App.cs,以及包含了上面执行代码的Awake()方法:

image.png

上红色的部分,可以对照上面文字说明的每一步,对应着拆箱和装箱的操作。

我们注意一个细节:IL代码的大小是56KB

下面我们使用中另一句输出,看看会有什么结果?

Console.WriteLine(v+","+o);
image.png

只进行了两次装箱,直接引用o,省去了一次拆箱和装箱的操作,IL的代码大小是46K,小了10K

我们再看看最后一种输出情况 :

Console.WriteLine(v.toString()+","+o);
image.png

只有一次装箱操作,但空间只小了3K,原因是v调用了虚方法toString()

Example 4:

 System.Int32 v = 5;
    
        object o = v;
        v =123;
        Console.WriteLine(v);
        v = (System.Int32)o;
        Console.WriteLine(v);

这段代码,进行了几次装箱?

答案是只有一次装箱,Console.WriteLine方法有针对所有基元类型的重载方法,这里调用的是:
Console.WriteLine(int32),这样就不需要进行装箱的操作。

如果是在Unity当中,我换成Debug.Log(v) 会如何呢?

 System.Int32 v = 5;
    
        object o = v;
        v =123;
        Debug.Log(v);
        v = (System.Int32)o;
        Debug.Log(v);

答案是3次,Debug.Log(v)调用了两次,进行了2次装箱操作,原因是Debug.Log只有一个实现版本,只接受一个object做为参数,
所以只要是值类型,都要进行装箱操作,这也是为什么在一些优化的文章中,建议要在正式的线上版本关闭掉Debug.Log,只保
留必要的输出即可。因为很多Log的输出都是包含值类型的转换,不断的在拖管堆中进行内存的分配,增加GC运行的次数,这是不可取的!

这里就想到了另一点,我们可以参考Console.WriteLine多个重载的版本,为Debug.Log也为所有的值类型提供重载版本,只需要调用各自的toString()即可,这样就可以避免装箱操作,而且我们为System.xxx下的类型提供重载版本以后,原始只接收object的方法就可以停止使用了,也方便我们通过开关进行控制。

下面这是在网上看到的例子,很有意思

int a = 10;
int b = 10;
int c = 10;
string d = "30";
string e = a+b+c+d;
Debug.Log(e);

结果是多少?

这里主要看匹配了string的哪个concat重载版本。

public static String Concat(params String[] values);
        public static String Concat(params object[] args);
        public static String Concat(String str0, String str1, String str2, String str3);
        public static String Concat(String str0, String str1, String str2);
        public static String Concat(String str0, String str1);
        [CLSCompliant(false)]
        public static String Concat(object arg0, object arg1, object arg2, object arg3);
        public static String Concat(object arg0, object arg1, object arg2);
        public static String Concat(object arg0, object arg1);
        public static String Concat(object arg0);

会先执行a+b+c的结果=30
然后调用String.Concat(object,object)重载版本,进行字符串的连接。会进行一次拆箱。

string f = d+a+b+c;

这个结果是多少?

答案是30101010

a,b,c分别要进行三次装箱,而且最后调用的是String.Concat(params object[] args)重载版本进行连接。
并不是先计算d+a,返回值再加b,然后再加c,最后调用String.Concat(object,object)的版本。

我们要看+号左右是否满足运算的条件.

string g = a+b+d+c;

这个结果是多少?

答案是:203010

先计算a+b=20,20+d+c,则分别要进行2次装箱,调用String.Concat(object,object,object)重载版本。

string h = a+d+b+c;

这个结果是多少?

答案是:10301010

从左到右计算,a+d,需要将a进行装箱,d+b,b也要进行装箱,最后加c,则c也要进行装箱。三次装箱。
调用String.Concat(params object[] args)重载版本

再看下面这个例子,以下三种字符串的连接,哪种更高效?

string a = "a";
a+="b";
a+="c";
string a = "a";
string b = "b";
string c = "c";
string a = "a"+"b"+"c";

首先例子1,IL会定义字符串a,然后a+=b会调用一个String.Concat(string,string)进行字符串的连接操作,
然后再次调用String.Concat(string,string),连接字符串c. 调用了2次String.Concat(string,string)函数

例子2,定义了三个字符串,a,b,c,然后执行一次函数的调用String.Concat(string,string,string) 生成的IL文件要小于例子1

例子3,相当于直接定义了"abc"字符串,效率最高,IL对此进行了优化,例子2其次,例子1最差。

这是例子3的IL代码,非常的简洁:


image.png

这是例子1的IL代码:


image.png

差距还是比较明显的。

最的再简单啰嗦装箱/拆箱的步骤:

装箱三步曲:1.拖管堆分配内存空间 2.复制字段的值到堆中 3.返回堆中内存地址.

拆箱:获取已装箱类型各个字段的内存地址,通常拆箱会紧跟着复制,2.将堆中字段的值复制到栈中值类型的字段中.
(不是每次拆箱都紧跟复制)

感谢阅读,如文中有误,欢迎指正.

参考:

CLR via C#
详解.NET IL代码https://www.cnblogs.com/yinrq/p/5486103.html
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,793评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,567评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,342评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,825评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,814评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,680评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,033评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,687评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,175评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,668评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,775评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,419评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,020评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,206评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,092评论 2 351
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,510评论 2 343

推荐阅读更多精彩内容

  • >>格 风 劳动是必须的。劳动就是活着吃饭、睡觉,养家糊口并服从于上个月无端的指控无辜的来不及打开的蔷薇木槿花和虞...
    格风Mimixinzang阅读 469评论 3 11
  • 今天做项目出现接收信息的布局没有服从根目录布局,发现是布局管理器的问题,故作此记录区分两种的区别 第一种,Layo...
    奇点hooo阅读 181评论 0 0
  • 你说等你让我心疼的两个字当真 你说放心让我安心的两个字真的 你说神经让我懵逼的两个字慌啦 你问谁?我把你说的话当真...
    随心走终点见阅读 101评论 0 0
  • 年首岁终,春寒料峭。在寒冻的大地上,我看见那些镶嵌在枝桠上的鸟窝,孤傲的有如价值连城的黑宝石,一个个被坚挺的枝桠收...
    假寐先生阅读 1,471评论 53 51