第3章 数学回顾

3.1 微积分

(1)导数
(2)最优化问题:最大化和最小化
(3)偏导数
(4)多元最优化问题:所有偏导数的一阶导为零

3.2 线性代数

1. 矩阵
2. 方阵:
(1)行数m=列数n,a11、a22…ann为主对角线元素
(2)对角矩阵
(3)n级单位矩阵,I
3. 矩阵的转置
(1)定义:

矩阵的定义.png

(2)对称矩阵:
对称矩阵.png

4. 向量
(1)行向量/列向量
(2)向量a与向量b的点乘、正交
向量的点乘.png

5.矩阵的加法

矩阵加法.png

矩阵加法规则.png

6.矩阵的数乘

矩阵数乘.png

7. 矩阵的乘法

定义.png

左乘右乘.png

矩阵乘法规则.png

8.线性方程组
线性方程组.png

9. 逆矩阵
定义.png

求解线性方程组.png

运算规则.png

10. 矩阵的秩
线性相关.png

线性无关.png
秩.png

11. 二次型

欧几里得距离.png
加入单位矩阵.png
二次型.png
二次齐次多项式函数.png

备注:每一项都是二次的


1.png
2.png

此时,这个二次型是正定的,开头向上的抛物线


抛物线.png
二维二次型.png
半负定.png
判定.png
判定.png
线性变换.png
判定.png
二次型.png
变换.png

3.3 概率、条件概率

1. 概率

(1)含义:大量重复实验,事件发生的频率趋向的某个稳定值,记事件A发生的概率为P(A)
2. 条件概率

定义.png

含义:在B的条件下A发生的概率=A与B同时发生的概率除以B发生的概率
3. 独立事件
若P(A|B)=P(A),说明A与B是相互独立的事件,也可表达为P(AB)=P(A)P(B)
4. 全概率公式
全概率公式.png

3.4 分布与条件分布

1. 离散型概率分布

离散型概率分布.png

2. 连续型概率分布

连续概率密度函数.png

累积分布函数.png

3. 多维随机向量的概率分布

联合密度函数.png
边缘密度函数.png
累积分布函数.png

4. 条件分布

定义.png

条件密度函数的计算.png
累积分布.png

3.5 随机变量的数字特征

1. 期望

定义-离散型.png
定义-连续型.png

2. 方差

方差.png

3. 协方差

定义.png
公式.png
线性性质.png

4. 矩的概念

定义1.png
定义2.png
定义3.png
定义4.png

6. 条件期望

定义.png

理解:就是把一个大草帽放在一个二维坐标里边,按照X=x(具体数值)切一刀,观察在这个情况下y的均值。所以这个含义表示在X=x1情况下,Y的均值;X=x1情况下,Y的均值,以此类推。所以这里边说y已经被积掉了,E(Y|x)只是关于x的函数。

图示.png

7. 条件方差:即条件分布的方差

条件分布的方差.png

8. 向量的期望

向量期望.png

9. 向量的协方差

定义.png
定义2.png
公式.png

10.Stata的应用

sum

含义:查看变量的数量、均值、最大值、最小值,看看数据有没有什么大的错误

sum lnw,detail

含义:查看lnw更多更详细的指标,包括分位数、最值、样本容量、均值、方差、偏度、峰度

hist lnw,width(0.1)

(bin=25, start=4.605, width=.1)

含义:画出lnw的直方图,宽度设置为0.1,括号里边的是stata自动分了25组,从哪开始,以及宽度

Kdensity lnw,normal normop(lpattern(dash))

含义:①kdensity表示核密度估计(kernel density estimation),看做对直方图的光滑处理就可以了②normal:画出正太分布③normop即normal option,表示这是对normal的状态进行选择④lpattern表示line pattern,指线条的状态,这里选择了dash,即虚线

gen wage=exp(lnw)

kdensity wage

含义:这是考察工资本身的一个分布状态。发现工资的尾巴很长,但是取对数的话就比较接近正态分布

kdensity lnw if s==16

含义:条件分布

twoway kdensity lnw || kensity lnw if s==16,pattern(dash)

含义:把两个图放一起

twoway (kdensity lnw)(kensity lnw if s==16,pattern(dash))

含义:同上

stata结果.png

含义:通过sum来比较期望和条件期望(看均值)、标准差(std)

3.6 迭代期望定律

1. 定义

定理.png
定理.png

2. Stata实操

先求条件期望

sum lw if rns==0

含义:北方居民的工资对数,即E(lw|rns=0)=5.725644

sum lw if rns==1

含义:南方居民的工资对数,即E(lw|rns=1)=5.581083

stata结果.png

含义:北方居民的工资对数要高于南方居民

然后在加权平均

dis 5.725644(554/758)+5.581083(204/758)

得到:5.6867384

上边是按照公式计算的无条件期望,那么如何直接计算无条件期望呢?

sum lnw

得到:5.6867384

证明了:E(lnw)=Erns【E(lnw|rns)】

3. 迭代期望定律的推广

推广.png
  • 就是把Y换成了一个函数g(Y)

  • 注意右边第一个E是对x求期望,有时候会把这个下标省去

3.7 随机变量无关的三个层次概念

1.最强的概念:X与Y相互独立

定义.png

2. 中间概念:均值独立

定义.png
定义.png

3. 最弱的概念:线性不相关

4. 上述三种关系的关系

命题.png
证明.png

3.8 常用连续型统计分布

1. 正态分布

定义.png
定义.png

twoway function y=normalden(x),range(-5 5) xline(0) ytitle(概率密度)

含义:①range(-5,5)表示在横轴区间(-5,5)画此图②xline(0)表示在横轴x=0处画一条直线③“ytitle(概率密度)”表示将纵轴标签设为概率密度

Twoway function y=normalden(x),range(-5 10)||function z=normalden(x,1,2),range(-5 10) lpattern(dash) ytitle(概率密度)

含义:这是把两个图画在一起了,注意z=normalden(x,1,2),其中1和2分别表示期望与方差

图的形状:u决定了对称轴,方差决定离散程度,方差越大代表数据越分散,曲线越扁

2. 多维正态分布

定义.png
性质.png

3. 卡方分布

定义.png
定义.png

twoway function chi3=chi2den(3,x),range(0 20)||function chi5=chi2den(5,x),range(0 20) lp(dash) ytitle(概率密度)

含义:同时画出自由度为3和5的卡方分布

图形:自由度越高,方差越大,越扁

4. t分布

定义.png

Stata命令:twoway function t1=tden(1,x),range(-5 5)||function t5=tden(5,x),range(-5 5) lp(dash) ytitle(概率密度)

图形:自由度越高,图形越高,尾巴越薄,表示收敛的速度更快一些

5. F分布

定义.png

twoway function F20=Fden(10,20,x),range(0 5)||function F5=Fden(10,5,x),range(0 5) lp(dash) ytitle(概率密度)

可以打开图像编辑器继续对图像进行修改

  • 其他关于概率密度的信息:help density function

6. F分布与T分布的关系

关系.png

3.9 统计推断的思想

  • 总体与个体

  • 样本:希望样本是随机样本,并且服从独立同分布(iid:即被抽中的概率是一样的,且被抽中的概率不会相互影响)

  • 样本容量

  • 统计推断:根据样本数据,对总体性质进行推断的科学

  • 统计量与估计量

  • 希望估计量有良好的性质:无偏的,即即估计量距离真实的参数越近越好

  • “均方误差”的概念

定义.png
  • 均方误差可以分解为方差与偏差平方之和
命题.png

备注:因此均方误差最小化,可以看做在“估计量方差”与“偏差”之间进行权衡。比如一个无偏估计量,如果方差很大,可能不入一个有偏差但是方差很小的估计量

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,921评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,635评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,393评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,836评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,833评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,685评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,043评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,694评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,671评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,670评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,779评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,424评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,027评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,984评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,214评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,108评论 2 351
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,517评论 2 343

推荐阅读更多精彩内容