对于离散型随机变量X,用分布律P{X=k}来描述X 的取值规律,但对非离散型随机变量来说用分布律就行不通了。例如,等可能地向区间[0,2]上投点,设点落下的位置是X,计算事件{X=1}的概率
因为单点集的长度为零。由此可知,不能用分布律来描述X 的统计规律,需另外找一个合适的办法。先看一个例子。
例2.3.1 在一质量均匀的陀螺的圆周上均匀地刻上区间(0,1]上诸数字,旋转这陀螺,当它停下时,其圆周与桌面接触点的刻度x 是一个随机变量,求X 的分布函数。
解 由于陀螺刻度的均匀性,所以对于区间(0,1]内任一子区间(a,b]有
因为X 可能取的值为区间(0,1]上所有值,所以求X 的分布函数时,要将整个数轴分为3个区间来讨论。
当x≤0时,{X≤x}为不可能事件,此时F(x)=0;
当0<x≤1时,{X≤x}={0<X≤x},此时F(x)=x;
当x>1时,{X≤x}是必然事件,此时F(x)=1。
综上所述,求得X 的分布函数
若令
因而,研究类似的随机变量只需考虑f(x)即可。
定义2.3.1 设X 是随机变量,F(x)是X 的分布函数。若存在一个非负可积函数f(x),使对任意实数x,有
则称X 为连续型随机变量,f(x)称为X 的概率密度函数,简称密度或概率密度。
由定义可知,连续型随机变量的分布函数是一个连续函数。
对于连续型随机变量,就像物体质量的分布用质量密度描绘一样,人们用概率密度描绘其概率分布。
任一连续型随机变量的概率密度函数具有以下性质:
④若f(x)在点x 处连续,则有F′(x)=f(x)。
由性质②可知,介于曲线y=f(x)与x 轴之间的面积等于1,如图2.3.1所示。
由性质③可知,X 落在区间(x1,x2]的概率P{x1<X≤x2}等于区间(x1,x2]上曲线y=f(x)之下的曲边梯形面积,如图2.3.2所示。
由性质④可知,在f(x)的连续点x 处有
从这里看到,概率密度的定义与物理学中线密度的定义相似,这就是称f(x)为概率密度的原因。
由式(2.3.3)可知,若不计高阶无穷小,有
这表示X 落在区间(x,x+Δx]上的概率近似地等于f(x)Δx。
图2.3.1
图2.3.2
若有一个函数f(x)满足性质①和性质②,则该函数一定是某一个连续型随机变量的概率密度函数。
对连续型随机变量X,其分布函数F(x)是连续函数,因而P{X=a}=F(a)-F(a-0)=0。据此,在计算连续型随机变量落在某一区间的概率时,可以不必分该区间是开区间或闭区间或半开半闭区间。例如,有
在这里,事件{X=a}并不是不可能事件,但有P{X=a}=0,这就是说,若A 是不可能事件,则P(A)=0;反之,若P(A)=0,则不能说A 一定是不可能事件。
除了2.2节介绍的离散型随机变量及本节介绍的连续型随机变量外,还有所谓的奇异型随机变量。
例2.3.2 设有一均匀陀螺,在其圆周的半圈上都标明刻度1,另外半圈上均匀地刻上区间[0,1)上的数字。旋转这陀螺,求它停下时其圆周上触及桌面上的刻度X 的分布函数。
解 设落在刻度为1的半圈上的事件为H1,落在另外半圈上的事件为H2,则
由全概率公式,得
可看出,本题中随机变量X 的分布函数既不是阶梯形跳跃函数,也不是连续函数,它是奇异型随机变量。
例2.3.3 设连续型随机变量X 的密度函数为
试求:(1)A;(2)X 的分布函数F(x);(3)
解 (1)按概率密度函数性质,有
求得A=2。
(2)F(x)=由于被积函数f(t)为分段函数,因此需要对积分上限x 进行讨论。
①当x<0时,F(x)=0;
②当0≤x<时,F(x)=
③当时,F(x)=
⑤当时,F(x)=1。
故X 的分布函数为
(3)
下面介绍几种重要的连续型随机变量。
1.均匀分布
设连续型随机变量X 具有概率密度
则称X 在区间(a,b)上服从均匀分布,记作X~U(a,b)。
利用分布函数与概率密度函数之间的关系,可以求得服从均匀分布的随机变量X 的分布函数
f(x)及F(x)的图形分别如图2.3.3和图2.3.4所示。
图2.3.3
图2.3.4
如果随机变量落在区间(a,b)中的任意等长度的子区间内的可能性相同,或者说它落在子区间内的概率只依赖于子区间的长度而与子区间的位置无关,像这样的随机变量是服从均匀分布的。
例2.3.4 某汽车总站每隔3分钟发一趟车,乘客在3分钟内的任一时刻到达是等可能的,则乘客的候车时间X 在区间[0,3]上服从均匀分布,求乘客候车时间不超过2分钟的概率。
解 X 的概率密度函数为
所求概率
2.指数分布
如果随机变量X 的概率密度函数
其中λ>0为常数,则称X 服从参数为λ 的指数分布,记为X~E(λ)。
相应的分布函数为
指数分布广泛用于可靠性、排队、设备的更新和维修等问题中。例如,设备无故障运转的时间、设备的使用寿命或维修时间、设备相继出现两次故障的时间间隔等都服从指数分布。
指数分布具有无后效性,无后效性是指数分布的一条重要且特有的性质,它决定了指数分布的众多应用。可证明:如果T 服从参数为λ 的指数分布,则对于任意实数s,t>0,有
(www.xing528.com)
证明 对于任意s,t>0,有
无后效性表示,在等待时间已经超过s的情况下,至少需要再等待时间t的统计规律与已经等待了多长时间无关,就像重新开始等待一样。指数分布的无后效性源于泊松分布的无后效性,它是指数分布突出的特点。在应用中,有关等待时间的问题,凡是涉及指数分布的都可以得出比较简捷的结果。
可以证明,如果连续型概率分布具有无后效性,则它一定是指数分布。
例2.3.5 设顾客按平均每小时20人的近似泊松过程到达商店,求店主等候第一位顾客到达所需时间超过5分钟的概率。
解 设随机变量X 表示按分钟计算的等候时间,则参数概率密度函数为
从而所求概率
指数分布在可靠性的概率分析中有广泛的应用。产品的寿命X 是一个随机变量,常常服从指数分布,此时可靠度
产品的平均寿命是
例2.3.6 假设收音机的有效使用时间服从参数为0.125的指数分布。现在某人买了一台旧收音机,试求收音机还能使用8年以上的概率α。
解 以X 表示使用年限,由条件知X 服从参数为0.125的指数分布。不妨假设收音机已经使用了t年以上。由指数分布的无后效性,可见
3.正态分布
正态分布是最常见和最重要的连续型概率分布。自然界和人类社会中的许多现象都服从或近似地服从正态分布。有些随机变量的函数服从或近似地服从正态分布。大量随机变量之和在许多情况下近似地服从正态分布。这一切决定了正态分布有众多的应用。
设连续型随机变量X 的概率密度为
其中μ,σ(σ>0)为常数,则称X 服从参数为μ,σ2 的正态分布,记作X~N(μ,σ2),其相应的分布函数
正态分布亦称高斯(Gauss)分布。
正态分布的随机变量的概率密度函数具有以下性质。
①曲线f(x;μ,σ2)关于直线x=μ 对称。这说明对于任意h>0,有
②当x=μ 时取到最大值,f(μ)=当x 离μ 越远,f(x)的值越小,这表明对于同样长度的区间,当区间离μ 越远,X 落在这个区间的概率越小。在x=μ±σ处曲线有拐点,Ox轴为渐近线。
③若固定σ,改变μ 的值,则图形沿着Ox 平移,而不改变其形状(图2.3.5),可见正态分布的概率密度曲线的位置完全由参数μ 确定,μ 称为位置参数。
④若固定μ,改变σ,由最大值f(μ)=可知,当σ越小时图形变得越尖(图2.3.6),因而X 落在μ 附近的概率越大,σ称为尺度参数。
X 的分布函数为
如图2.3.7所示。
图2.3.5
图2.3.6
特别地,当μ=0,σ=1时,称X 服从标准正态分布。其概率密度和分布函数分别用φ(x),Φ(x)表示,即有
易知
如图2.3.8所示。
图2.3.7
图2.3.8
人们又编制了Φ(x)的函数表,可供查用(附表2)。
表中对于x≥0给出了Φ(x)的值;对于x<0,利用关系式Φ(x)=1-Φ(-x)计算Φ(x)的值。
例如,
常用的结果有
下面给出一般正态分布与标准正态分布的关系。
对于任意实数a,b(a≠0),如果X~N(μ,σ2),则Y=aX+b~N(aμ+b,a2σ2)。特别地,(1)若X~N(μ,σ2),则U=(X-μ)/σ~N(0,1);(2)若U~N(0,1),则X=σU+μ~N(μ,σ2)。
证明 设X~N(μ,σ2),则当a>0时Y=aX+b的分布函数为
当a<0时,Y=aX+b的分布函数为
于是Y=aX+b~N(a+bμ,a2σ2)。作为上述结果的特殊情形容易得出(1)和(2)的结论。
若X~N(μ,σ2),则X 的分布函数F(x)可以通过标准正态分布的分布函数Φ(x)表示为
从而,可以使用标准正态分布的各种数值表进行相应的运算。例如,
一般地有结论:
例如,设X~N(1,4),查表得
例2.3.7 设随机变量X 服从正态分布N(3,4),试求常数C,使
(1)P{X<C}=P{X≥C};
(2)P{X<C}=2P{X≥C}。
解 (1)由X~N(3,4)可见,其分布曲线关于直线x=3对称,即
因此C=3。
(2)由P{X<C}=2P{X≥C}可见
由于U=(X-3)/2~N(0,1),可见
其中Φ(x)是标准正态分布函数,由其数值表(附表2)可见
例2.3.8 假设某年级学生“概率论与数理统计”课程考试的成绩(百分制)服从正态分布N(μ,σ2)。考试成绩75分以下者占34%,而90分以上者占14%,试求分布参数μ,σ2。
解 由条件知考试成绩X~N(μ,σ2),
由标准正态分布函数表(附表1)可查得:
由此得关于μ 和σ 的联立方程组
解得μ≈79.13,σ2≈10.072。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。