从零开始利用Excel与Python进行数据分析
上QQ阅读APP看书,第一时间看更新

2.2.1
随机变量

如果一个变量在数轴上的取值依赖随机现象的基本结果,则称此变量为随机变量。如果随机变量仅取数轴上的有限个点,则称此随机变量为离散型随机变量。如果一个随机变量可取值为数轴上的一个区间,则称此随机变量为连续型随机变量。

1.概率分布函数

假设X为一个随机变量,对于任意实数X,事件“XX”的概率是X的函数,记为FX)=PXX),这个函数称为X的累计概率分布函数,简称分布函数。

图2-2 计算几何概率

下面通过计算几何概率的例子理解概率分布函数。如图2-2所示,向半径为R的圆内随机投掷一个点,计算投掷点落在半径为X的圆内的概率。

投掷点落在半径为X的圆内的概率的计算方法为:半径为X的圆的面积÷半径为R的圆的面积;对应的概率分布函数为:。计算投掷点落在距离圆心1/3半径圆内的概率为,得到的概率为1/9。

2.期望

(1)离散型随机变量的期望。

若离散型随机变量X的可取值为X1X2X3,……,Xn,则取值为xi的概率为PX=xi),对应的期望为

下面举例说明离散型随机变量期望的计算方法。假设我们用10000元购买某股票,该股票当前价格为4元,一年后价格可能变为1元、2元、4元、7元,通过计算期望评估是否要购买该股票。先计算当前可购买的股票数为10000÷4=2500(股),一年后股票价格有4种可能,每种可能的概率为25%。随机变量对应概率如表2-7所示,期望为E=1×2500×25%+2×2500×25%+4×2500×25%+7×2500×25%=8750(元),比本金10000元少。

表2-7 离散型随机变量期望计算

(2)连续型随机变量的期望。

假设连续型随机变量X的密度函数为pX),则在区间[ab]中对应的期望为