激活函数(activation functions)二三事-性质、作用与选择

一. 引言

神经网络是由具有适应性的简单单元组成的广泛并行互连的网络,
它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应

如今神经网络已经为很多人所熟知,很多很多复杂的网络结构出现在我们面前。在我们日常编写神经网络代码的过程中,激活函数似乎已经是一种很自然正常的操作。可是,激活函数的原理,激活函数的性质,为什么需要激活函数,有哪些常用的激活函数,如何选用?也需要我们更加深入的了解。

二. 神经元

神经网络中最基本的成分是神经元 (neuro且)模型,即上述定义中的"简单单元"在生物神经网络中,每个神经元与其他神经元相连,当它"兴奋"时,就会 向相连的神经元发送化学物质,从而改变这些神经元 内的电位;如果某神经元的电位超过了 一个"阔值" (threshold) , 那么它就会被激活,即 "兴奋 "起来,向其他神经元发送化学物质。之前说深度网络就是模拟这种生物神经网络的,那么深度学习里的激活函数就是模仿这种神经元的激活方式。

这是一个简单的神经元模型,它接收N个输入X1, X2, ... ,Xn。并为每个输入赋予一个权重W1, W2, ... ,Wnb是偏置参数(可以理解为为了更好的达到目标而做调整的参数)

  • X是该神经元接受的N个输入
  • W是N维的权重向量
  • z 表示一个神经元所获得的输入信号x的加权和,称为神经元的状态
  • f激活函数
  • a为神经元的活性值,也即该神经元的输出

到这里我们知道了神经元接受了多个输入后,必须要通过"激活函数"处理才会产生最终输出。

三. 理想的激活函数(阶跃函数)

理想中的激活函数是图所示 的阶跃函数,它将输入值映射为输出值 "0"或“1”,显然 "1" 对应于神经元兴奋 , "0" 对应于神经元抑制。这种情况是最符合生物特性的,但是阶跃函数具有不连续 、不光滑等不太好的性质,所以它无法被用于神经网络的结构。

既然理想的激活函数无法适用于我们的神经网络结构,那激活函数应该具有什么样的性质呢?

四. 激活函数的性质

  • 可微性:计算梯度时必须要有此性质。
  • 非线性:保证数据非线性可分。
  • 单调性:保证凸函数。
  • 输出值与输入值相差不会很大:保证神经网络训练和调参高效。

五. 激活函数的作用(非线性)

能使得神经网络的每层输出结果变得非线性化

非线性化的作用
能使得神经网络的每层输出结果变得非线性化。

线性可分


线性不可分


六. 常用的激活函数

  1. Sigmoid
  • 经典的激活函数
  • 挤压函数:把一个实数压缩至0到1之间。当z是非常大的正数时,g(z)会趋近于1,而z是非常大的负数时,则g(z)会趋近于0。
  • 挤压的好处:分类分类的概率,比如激活函数的输出为0.9的话便可以解释为90%的概率为正样本。


  • 微分形式简单,可以用自身表示。
  • Sigmoid函数饱和使梯度消失。当神经元的激活在接近0或1处时会饱和,在这些区域梯度几乎为0,这就会导致梯度消失,几乎就有没有信号通过神经传回上一层
  • Sigmoid函数的输出不是零中心的。因为如果输入神经元的数据总是正数,那么关于W的梯度在反向传播的过程中,将会要么全部是正数,要么全部是负数,这将会导致梯度下降权重更新时出现z字型的下降。
  1. TANH双曲正切

  • 是sigmoid函数的一种变体,它的取值范围为【-1,1】,而不是sigmoid函数的【0,1】
  • 定义域R,同样是挤压函数。
  • 解决了输出不是零中心,但饱和问题仍然存在。
  1. ReLU

  • 相对于前面两者没有任何指数级运算,对网络计算加速具有巨大作用。
  • 单侧抑制
  • 只需要一个阈值就可以得到激活值,而不用去算一大堆复杂的运算。
  • 容易死掉

4.Leaky ReLU
个人第一次使用是在训练GAN的过程中。


  • 给与一个很小的负数梯度值,使负轴信息不会全部丢失,解决了ReLU神经元“死掉”的问题

参考
https://zhuanlan.zhihu.com/p/32610035

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,445评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,889评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,047评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,760评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,745评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,638评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,011评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,669评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,923评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,655评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,740评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,406评论 4 320
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,995评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,961评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,023评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,483评论 2 342

推荐阅读更多精彩内容

  • 改进神经网络的学习方法(上) 当一个高尔夫球员刚开始学习打高尔夫时,他们通常会在挥杆的练习上花费大多数时间。慢慢地...
    nightwish夜愿阅读 2,904评论 2 8
  • 有两天没写日记了,老觉得心里缺个什么似得,从之前多年不写日记到坚持完21天日记星球写作,后面也断断续续的记录着自己...
    911510864995阅读 197评论 1 4
  • 为什么友谊的小船说翻就翻?要不然怎么坠入爱河… 如果你觉得我哪里不对,请一定要告诉我,反正我也不会改,别憋坏了… ...
    九九重阳时阅读 478评论 0 2
  • 一场秋雨,将弥漫的尘雾一扫而空。 碧空万里,书写的不光是夏日的澄澈 行走在秋的环视中,是增添秋的美还是享受秋的吻?...
    沙漠里的胡杨v阅读 299评论 0 2
  • 本篇为语言学习日常交流中常见的词汇列表,约500个词汇。对于一门语言,掌握这些词汇和相关语法可以做普通的日常交流以...
    我什么都不知道呀阅读 1,739评论 3 10