数学基础Part

——数学基础部分,包括标量、向量、矩阵、张量,导数&偏导数,特征值&特征向量,概率&分布。

一、“量”

概念

标量:单独的“数”。

向量:一维有序排列的数。

矩阵:二维数据表形式。

张量:N维,基于向量和矩阵的推广。0阶张量是标量,1阶张量是向量,2阶张量是矩阵,3阶可表示如RGB彩色图像。

向量范数

1范数:各元素的绝对值的和

2范数:各元素的平方和的平方根

p范数:1范数和2范数的普遍形式,||X||_{p}=(\sum_{i=1}^n |x_{i}|^{p})^ \frac{1}{p}

负无穷范数:最小的绝对值

正无穷范数:最大的绝对值

矩阵范数

无穷范数(行模):取最大的行的绝对值和,||A||_{\infty } = max_{1\leq i \leq n} \sum_{j=1}^{m} |a_{ij}|

核范数:A的奇异值之和(即SVD)。

L0范数:A非零元素的个数。

L1范数(列模):取最大的列的绝对值和,||A||_{1 } = max_{1\leq j \leq m} \sum_{i=1}^{n} |a_{ij}|

F范数:各个元素平方和的平方根,通常也叫L2范数。

2范数(谱模):A^{T}A矩阵的最大特征值的平方根,||A||_{2}=\sqrt{\lambda _{max}(A^{T}A)} =\sqrt{\max_{1\leq i \leq n} |\lambda_{i}|}

L21范数:先求每列的F范数,再将结果求L1范数,它是介于L1和L2之间的一种范数。

二、“导”

导数:对含有一个自变量的函数进行求导,就是曲线在某一点切线的斜率。

偏导数:对多于一个的自变量的函数中的一个自变量求导,就是函数在某一点上沿坐标轴正方向的的变化率。(注:求解时将另外一个变量看做常数。)

三、特征值&奇异值

特征值:对于n阶方阵A,若存在n维非零向量x,使得Ax=\lambda x,则x为A的特征向量,\lambda为A的特征值。特征值表示的是这个特征到底有多重要,而特征向量表示这个特征是什么。特征值分解的局限在于变换的矩阵必须是方阵。

奇异值:奇异值分解(SVD)适用于任意矩阵。将A与其转置相乘A^{T}A将会得到一个方阵,再求特征值。对于非奇异矩阵进行奇异值分解(SVD),得到的奇异值,就是特征值。(注:奇异矩阵是行列式为 0 的矩阵,即不可逆矩阵;非奇异矩阵是行列式不为 0 的矩阵|A|\neq 0,也就是可逆矩阵。)

四、概率

随机变量:当变量的取值的概率不是1时,变量就变成了随机变量。

概率分布:用来描述随机变量或一簇随机变量的每一个可能的状态的可能性大小的方法。

概率质量函数(Probability Mass Function, PMF):描述离散型随机变量的概率分布P。

概率密度函数(Probability Density Function, PDF):描述连续型随机变量的概率分布p。

​联合概率:联合概率指类似P(X=a,Y=b)这样,包含多个条件,且所有条件同时成立的概率。联合概率是指在多元的概率分布中多个随机变量分别满足各自条件的概率。

​边缘概率:边缘概率是某个事件发生的概率,而与其它事件无关。边缘概率指类似于P(X=a),仅与单个随机变量有关的概率。

链式法则:条件概率得出,P(AB) = P(B|A)*P(A)进行多轮的推广,即P(A_1 A_2 ... A_n)=P(A_1)\prod_{i=2}^{n}P(A_i|A_1A_2...A_{i-1})

独立:两个随机变量x、y,概率分布表示成两个因子乘积形式,一个因子只包含x,另一个因子只包含y,两个随机变量相互独立。

条件独立:​给定Z的情况下,X和Y条件独立,当且仅当X\bot Y|Z \iff P(X,Y|Z) = P(X|Z)P(Y|Z)

五、分布

伯努利分布(离散):即0-1分布,只有两种结果(p和1-p概率)、独立的随机实验,期望p,方差p*(1-p),相当于N=1的二项分布(执行n次可叫n重伯努利试验)。

二项式分布(离散):X~b(n,p)即N次独立重复事件,相当于N次伯努利,期望np,方差n*p*(1-p)。

几何分布(离散):伯努利试验发生N次首次成功的概率(即前n-1次都失败),记为X~GE(p),即(1-p)^(k-1),N的概率分布期望EX=1/p,方差DX=(1-p)/p^2

泊松分布(离散):单位时间内随机事件发生的次数的分布X~P(λ),期望和方差都是λ (λ>0)。若随机变量X取自然数,在n次独立试验中出现的次数x恰好为k次的概率:P(X=K)=\frac{e^{-\lambda}\lambda ^{k}}{k!}

正态分布(连续):即高斯分布,当影响因素很多,没有完全左右结果的因素,则呈现正态分布X~N(μ,σ^2),期望μ,方差σ^2。

卡方分布(连续):k个标准正态分布即X~N(0,1)的平方和构成了服从自由度为k的卡方分布,X~\chi^2 ,期望为自由度k,方差为2k。

拉普拉斯分布:允许我们在任意一点 $\mu$处设置概率质量的峰值Laplace(x;\mu;\gamma)=\frac{1}{2\gamma}exp\left(-\frac{|x-\mu|}{\gamma}\right)

指数分布:用来描述在x=0点处取得边界点的分布,  p(x;\lambda)=\lambda I_{x\geq 0}exp(-\lambda{x}) 。指数分布用指示函数I_{x\geq 0}​来使x取负值时的概率为零。

狄拉克分布(连续):保证概率分布中所有质量都集中在一个点上。狄拉克分布的狄拉克函数(也称单位脉冲函数)定义为如图所示。

狄拉克函数

分布相关概念

期望:表示事件可能结果的概率乘以其结果的累加和,反映随机变量平均取值的大小,E(ax+by+c) = aE(x)+bE(y)+c。离散函数期望为E(f(x))=\sum_{k=1}^{n}{f(x_k)P(x_k)},连续函数期望为E(f(x))=\int_{-\infty}^{+\infty}{f(x)p(x)dx}。(注:如果X、Y相互独立,则E(xy)=E(x)E(y)​。)

方差:表示随机变量和其数学期望(即均值)之间的偏离程度,Var(x) = E((x-E(x))^2)。具有性质Var(x) = E(x^2) -E(x)^2,如果X、Y相互独立,则Var(ax+by)=a^2Var(x)+b^2Var(y)

协方差:表示两个变量线性相关性强度,Cov(x,y)=E((x-E(x))(y-E(y))),具体计算公式为Cov(\sum_{i=1}^{m}{a_ix_i}, \sum_{j=1}^{m}{b_jy_j}) = \sum_{i=1}^{m} \sum_{j=1}^{m}{a_ib_jCov(x_iy_i)} 。独立变量的协方差为0。

相关系数:表示变量之间线性相关程度,Corr(x,y) = \frac{Cov(x,y)}{\sqrt{Var(x)Var(y)}}。具有有界性( [-1,1]);值越接近1,两个变量越正相关;越接近-1,越负相关性越强,为0时无相关性。


参考文献

1、《深度学习500问》 https://github.com/scutan90/DeepLearning-500-questions

2、向量与矩阵的范数(比较1-范数、2-范数、无穷范数、p-范数、L0范数 和 L1范数等) https://blog.csdn.net/zaishuiyifangxym/article/details/81673491

3、特征值和奇异值的关系 https://blog.csdn.net/qq_36653505/article/details/82052593

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,684评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,143评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,214评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,788评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,796评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,665评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,027评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,679评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,346评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,664评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,766评论 1 331
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,412评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,015评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,974评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,073评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,501评论 2 343

推荐阅读更多精彩内容