随机变量概述
随机变量与事件
随机变量的本质是一种函数(映射关系),在古典概率模型中,“事件和事件的概率”是核心概念;但是在现代概率论中,“随机变量及其取值规律”是核心概念。
随机变量的分类
随机变量从其可能取的值全体的性质可以分为两大类:离散型随机变量和连续型随机变量。
离散型随机变量
离散型随机变量的取值在整个实数轴上是间隔的,要么只有有限个取值,要么是无限可数的。
常见的离散型随机变量包括以下几种:
0-1分布(也叫两点分布或伯努利分布,bernouli distribution)
又叫做0-1分布,指一次随机试验,结果只有两种。也就是一个随机变量的取值只有0和1。
最简单的例子就是,抛一次硬币,预测结果为正还是反。二项分布(binomial distrubution)
表示n次伯努利实验的结果。
例子就是,求多次抛硬币,预测结果为正面的次数。
P(X=0) = 1/32
P(X=1) = 5/32
P(X=2) = 10/32 = 5/16
P(X=3) = 10/32 = 5/16
P(X=4) = 5/32
P(X=5) = 1/32
这是随机变量X 表示五次抛硬币出现的正面的次数;
二项分布的期望值公式:E(X) = np
-
几何分布
泊松分布
泊松分布就是描述某段时间内,事件具体的发生概率。
日常生活中,大量事件是有固定频率的。
某医院平均每小时出生3个婴儿
某公司平均每10分钟接到1个电话
某超市平均每天销售4包xx牌奶粉
某网站平均每分钟有2次访问
它们的特点就是,我们可以预估这些事件的总数,但是没法知道具体的发生时间。
泊松分布的图形大概是下面的样子。
可以看到,在频率附近,事件的发生概率最高,然后向两边对称下降,即变得越大和越小都不太可能。
- 超几何分布
一个袋子中有n个球,其中r个是黑球,n-r是白球,从袋中取出m个球,让X表示取出球中的黑球的个数,那么X是一个符合超几何分布(hypergeometric distribution)的随机变量。
连续型随机变量
连续型随机变量的取值要么包括整个实数集(−∞,+∞),要么在一个区间内连续,总之这类随机变量的可能取值要比离散型随机变量的取值多得多,它们的个数是无限不可数的。
常见的连续型随机变量包括以下几种:
-
均匀分布
指数分布
指数分布是事件的时间间隔的概率。下面这些都属于指数分布。
婴儿出生的时间间隔
来电的时间间隔
奶粉销售的时间间隔
网站访问的时间间隔
指数分布的公式可以从泊松分布推断出来。
指数分布的图形大概是下面的样子。
可以看到,随着间隔时间变长,事件的发生概率急剧下降,呈指数式衰减。
-
正态分布
正态分布是比较常见的,最常用的分布就是正态分布(normal distribution),也称为高斯分布 (Gaussian distribution),譬如学生考试成绩的人数分布等。
随机变量的基本性质
随机变量最主要的性质是其所有可能取到的这些值的取值规律,即取到的概率大小。如果我们把一个随机变量的所有可能的取值的规律都研究透彻了,那么这个随机变量也就研究透彻了。随机变量的性质主要有两类:一类是大而全的性质,这类性质可以详细描述所有可能取值的概率,例如累积分布函数和概率密度函数;另一类是找到该随机变量的一些特征或是代表值,例如随机变量的方差或期望等数字特征。