概率论与数理统计浙大版第四章Review

前面介绍的随机变量的分布律、分布函数和概率密度函数都能完整地描述随机变量。但在某些实际问题中,更关心一些描述随机变量的常数。本章介绍这些常数。对于单个随机变量(一维随机变量或多维随机变量中的某个),有k阶原点矩k阶中心矩。其中重点介绍的有1阶原点矩(期望)和2阶中心矩(方差)。对于二维随机变量X和Y,有k+l阶混合矩k+l阶混合中心矩。其中重点介绍了2阶混合中心矩中的协方差。二维随机变量有4种2阶混合中心矩,组成了协方差矩阵,这是一个对称的矩阵。由此推广到n维随机变量的情况,n维随机变量的2阶混合中心矩共有n^2个,组成的协方差矩阵,可以解决n维随机变量分布函数过于复杂不方便处理的问题。另外,由二维随机变量协方差适当变形得到的相关系数,引出了(线性)相关独立的区别与联系的问题。本章还介绍了切比雪夫不等式,为下一章进行了铺垫。需要注意的是,本章介绍的随机变量的数字特征,是根据变量的分布得出的常数,常用来描述随机变量的某些特征或是在分布函数过于复杂的时候作简化的替代,因此对于随机变量的描述,这些数字远没有分布精确


数学期望

数学期望是随机变量的1阶原点矩,简称期望,又称均值。它完全由随机变量的分布确定,若X服从某一分布,也称E(X)是这一分布的数学期望。

对于离散型随机变量,分布律为P(X=x_{k} )=p_{k} ,若级数\sum_{k=1}^∞x_{k} p_{k} 绝对收敛,则称该级数的和为随机变量X的期望。

对于连续性随机变量,概率密度函数为f(x),若积分\int_{-∞}^{∞} xf(x)dx绝对收敛,则称该积分的值为随机变量X的期望。

存在随机变量不存在的情况,一般来说若级数或积分不绝对收敛,该随机变量不存在期望。


设Y是随机变量X的函数Y=g(X)

如果X是分布律为P(X=x_{k} )=p_{k} 的离散型随机变量,若\sum_{k=1}^∞g(x_{k}) p_{k} 绝对收敛,则该级数和为Y的期望。

如果X是概率密度函数为f(x)的连续型随机变量,若\int_{-∞}^{∞} g(x)f(x)dx绝对收敛,则该积分值为Y的期望。


数学期望具有以下性质:

C为常数,则E(C)=C.

X为一个随机变量,C是常数,则E(CX)=CE(X).

X、Y是两个随机变量,则E(X\pm Y)=E(X)\pm E(Y),可以推广到任意有限个随机变量之和情况。( 没有相互独立的要求)

X、Y是两个相互独立的随机变量,则E(XY)=E(X)E(Y),可以推广到任意有限个相互独立的随机变量之积情况。


方差

方差用来度量随机变量与其期望的偏离程度,设X是一个随机变量,若E\{[X-E(X)]^2 \}存在,则称该项为随机变量X的方差,记为D(X)Var(X)。在应用上还引入了\sqrt{D(X)} ,记为\sigma (X),称为标准差均方差D(X)=0当且仅当P\{X=E(X)\}=1

D(X)=E(X^2 )-[E(X)]^2


方差具有以下性质:

C是常数,则D(C)=0

X为随机变量,C为常数,则D(CX)=C^2D(X)D(X+C)=D(X)

X、Y为两个随机变量,则D(X\pm Y)=D(X)+D(Y)\pm 2E\{[X-E(X)][Y-E(Y)]\},若X,Y相互独立,则D(X\pm Y)=D(X)+D(Y)


常见分布的期望与方差

(0-1)分布P\{X=0\}=1-pP\{X=1\}=p

E(X)=p,D(X)=p(1-p)

参数为(n,p)的二项分布:

E(X)=np,D(X)=np(1-p)

参数为\lambda 的泊松分布:

E(X)=\lambda ,D(X)=\lambda

参数为(a,b)的均匀分布:

E(X)=\frac{a+b}{2} ,D(X)=\frac{(b-a)^2 }{12}

参数为\theta 的指数分布(f(x)=\frac{1}{\theta } e^\frac{-x}{\theta } ,x>0):

E(X)=\theta ,D(X)=\theta ^2

参数为(\mu ,\sigma ^2 )的正态分布:

几何分布,设成功的概率为p:

负二项分布,设成功的概率为p,要求成功的次数为r:


标准化变量

对任意随机变量X,若存在期望E(X)和方差D(X),作X^*=\frac{X-E(X)}{\sqrt{D(X)} } ,称X^*X的标准化变量。E(X^* )=0,D(X^* )=1。对变量进行标准化在机器学习数据预处理有应用,使问题容易处理。


切比雪夫不等式

设随机变量X具有数学期望E(X)=\mu ,方差D(X)=\sigma ^2 ,则对于任意正数\varepsilon ,有不等式

P\{\vert X-\mu \vert\geq \varepsilon  \}\leq \frac{\sigma ^2 }{\varepsilon ^2 } 成立。该不等式就是切比雪夫不等式。

切比雪夫不等式的意义是,随机变量的分布未知,只知道期望和方差时,能够估计P\{\vert X-\mu \vert <\varepsilon  \}的概率。这种估计非常粗略,如果知道分布的话可以计算出概率的准确值。


线性相关与相互独立

介绍方差性质的时候,有一条:D(X\pm Y)=D(X)+D(Y)\pm 2E\{[X-E(X)][Y-E(Y)]\},若随即变量X、Y相互独立,则E\{[X-E(X)][Y-E(Y)]\}=0

现在引入一个新的概念,协方差Cov(X,Y)=E\{[X-E(X)][Y-E(Y)]\}。协方差是用来解释两个随机变量在变化时是同向变化还是异向变化,同向变化协方差为正,异向变化协方差为负,数值越大说明变化相似度越高。

关于协方差的性质:

Cov(X,Y)=E(XY)-E(X)E(Y)

Cov(aX,bY)=abCov(X,Y)

Cov(X+Y,Z)=Cov(X,Z)+Cov(Y,Z)

协方差是无量纲的,为了剔除量纲的影响,引入了相关系数\rho _{XY} =\frac{Cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y )}  } 。相关系数是在协方差的基础上除以两个随机变量的标准差,这样就把协方差的数值标准化到[-1,1]区间内,使人们能够更多地关注两个随机变量变化相似程度,而不是变化幅度大小。当相关系数等于\pm 1,说明两个随机变量变化程度完全一致 ,你变大一倍我也变大(变小,若\rho =-1)一倍,是完全的线性关系。若相关系数等于0,则说明两个变量没有线性关系,可能存在其它关系,例如W型或圆圈型。因此相关系数是反映两个随机变量的线性关系程度。

生活中的情况,两个随机变量大多数不遵从严格的数学关系,比较的时候大多数是近似地看一下线性关系。例如可能遵从二次关系(两个随机变量取>0)、对数关系的两个随机变量,呈现同向变化的趋势,因此具有较强的线性关系。如果要具体看遵从什么关系,还是要从分布函数入手。

相关系数是从线性关系入手,粗略地对随机变量进行判断;相对独立是从分布入手,详细地比对。因此相对独立强度比相关系数高,从相对独立可以推出线性无关,但不能反推。

协方差、相关系数的意义详细推导见下文:如何通俗易懂地解释「协方差」与「相关系数」的概念?


矩和协方差矩阵

矩是随机变量的数字特征。设X,Y为随机变量,若以下期望存在,则:

E(X^k )称为X的k阶原点矩,简称k阶矩。

E\{[X-E(X)]^k \}称为X的k阶中心矩。

E(X^k Y^l )称为XY的k+l阶混合矩。

E\{[X-E(X)]^k [Y-E(Y)]^l \}称为XY的k+l阶混合中心矩。

由此可见,期望是1阶矩,方差是2阶中心矩,协方差是2阶混合中心矩。


2维随机变量存在4个2阶混合中心矩,n维随机变量存在n^2 个2阶混合中心矩,可以组成一个对称的n阶矩阵,称为协方差矩阵。n维随机变量分布函数很复杂或不知道的情况下,协方差矩阵可以处理相关问题。


N维正态随机变量

n维正态分布是现实中经常遇到的模型。n维正态随机变量具有下面的性质:

对于正态分布来说,线性不相关和相对独立可以看作等价。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,376评论 6 491
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,126评论 2 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 156,966评论 0 347
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,432评论 1 283
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,519评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,792评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,933评论 3 406
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,701评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,143评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,488评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,626评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,292评论 4 329
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,896评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,742评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,977评论 1 265
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,324评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,494评论 2 348