首页 理论教育 概率统计:全概率公式、贝叶斯公式及应用案例

概率统计:全概率公式、贝叶斯公式及应用案例

时间:2023-10-18 理论教育 版权反馈
【摘要】:全概率公式与贝叶斯公式是概率论中重要的公式,有非常广泛的应用。证明 由条件概率公式有常见教材中的全概率公式与贝叶斯公式是针对“多因一果”的情形。事实上,“多因多果”的情形也很常见,因此我们对全概率公式与贝叶斯公式分别进行了推广。

概率统计:全概率公式、贝叶斯公式及应用案例

导读:全概率公式与贝叶斯公式作为条件概率的一个重要应用,其本身蕴含着事件间的因果关系分析:由因导果,由果索因,这种因果关系分析也可以上升到哲学因果论;先验概率与后验概率也可以上升到哲学认识论,对样本空间或事物的完备划分也是人们认识事物和解决问题的一种基本思路方法,遍布于数学领域和其他各领域。

全概率公式与贝叶斯公式是概率论中重要的公式,有非常广泛的应用。我们先引入样本空间Ω 的划分的定义。

1.定义

设Ω 为样本空间, A1、 A2 、…、 An 为Ω 的一组事件,若满足

2.定理(全概率公式)

设 A1、 A2 、…、 An 为样本空间Ω 的一个划分,且 P ( Ai ) > 0(i=1,2,…,n),B 为样本空间Ω 的任一事件,则有

此公式为全概率公式。

证明 P ( B )=P ( BΩ )=P[ B (A1 ∪ A2∪…∪An )]=P (BA1 ∪BA2∪…∪BAn )=P (BA1)+P (BA2)+ …+P (BAn )=P ( A1 ) P ( B | A1)+P ( A2 ) P ( B | A2)+ …+P ( An ) P ( B | An)。

全概率公式可以通过事件之间的“因果关系”来理解,相当于“多因一果”,事实上也是“多因二果”,因为结果B 与B 相伴发生。

全概率公式基于对样本空间Ω 的划分,其认识思想是由因导果,在许多实际问题中事件B 的概率不易直接求得,如果容易找到Ω 的一个划分 A1、A 2 、…、A n ,且 P ( Ai )和 P ( B | Ai)为已知,或容易求得,那么就可以根据全概率公式求出结果B 发生的概率 P ( B )。当然,结果B 发生的概率P( B) = 1 -P( B)也随之得到,也可以用全概率公式

全概率公式涉及的思想就是由因导果。下面介绍蕴含由果索因思想的贝叶斯公式。

3.定理(贝叶斯公式)

称上式为贝叶斯公式,也称为逆概率公式。

证明 由条件概率公式有

常见教材中的全概率公式与贝叶斯公式是针对“多因一果”的情形。事实上,“多因多果”的情形也很常见,因此我们对全概率公式与贝叶斯公式分别进行了推广。有兴趣者可查阅多层贝叶斯公式、贝叶斯网络的相关知识,并补充一个贝叶斯公式在法庭审判中的案例。

由贝叶斯公式得,

例1(用数字说话的奖惩制度) 设某工厂有甲、乙、丙3 个车间生产同一种产品,产量依次占全厂的45%、35%、20%,且各车间的次品率分别为4%、2%、5%,现在从一批产品中检查出1 个次品,问该次品是由哪个车间生产的可能性最大?(www.xing528.com)

解 设A1、A2、A3 表示产品来自甲、乙、丙三个车间,B 表示产品为“次品”的事件,易知A1、A2、A3 是样本空间Ω 的一个划分,且有P ( A1 ) =0.45,P ( A2 ) =0.35,P ( A3 ) =0.2,P ( B | A1 ) =0.04,P ( B | A2 ) =0.02,P ( B | A3 ) =0.05。

由全概率公式得,P ( B )=P ( A1 ) P ( B | A1)+P ( A2 ) P ( B | A2)+P ( A3 ) P ( B | A3) =0.45 ×0.04+0.35 ×0.02 +0.2 ×0.05 =0.035。

由贝叶斯公式得,P ( A1 | B ) =(0.45 ×0.04)/0.035 =0.514,P ( A2 | B ) =(0.35 ×0.02)/0.035 =0.200,P ( A3 | B ) =(0.20 ×0.05)/0.035 =0.286。

由此可见,该次品由甲车间生产的可能性最大。有趣的是,甲车间的次品率为4%不是最大,但该次品由甲车间生产的可能性最大,主要因为甲车间的产量占全厂的45%(为最大)。这与现实生活中的好多事实是相符的,比如技术虽好,但干活多了,出错的概率难免会大一些,相反,技术虽差,但干活很少,出错的概率自然不大。可知,全概率公式与贝叶斯公式就是这种科学事实的数学依据,告诉管理者鼓励职员多干活,干了多少活就应得到相应的工作量报酬,而不是干错就找到出错来源的大小并按此惩罚,那样的话,有谁愿意去多干活呢?毕竟,每个人出错的概率应该不高于某个给定标准,否则或使其退出职位或自费培训,只是针对少数人的惩罚,正所谓“罚不择众”。

这就是说,根据以往的调查人群中患有癌症的概率 P ( A) =0.005为先验概率。而在得到信息(即试验结果反应为阳性)之后再加以重新修正的概率(即在试验反应为阳性的条件下,患有癌症的概率) P ( A | B) =0.087为后验概率。先验概率只是基于人们对某事件的初步认识下得到该事件发生可能性大小的一个度量,后验概率是在补充信息的条件下对原来认识不够充分的这个事件发生可能性大小的修正度量,依次类推,可以促进人们在诸多信息下对某事件发生可能性大小的不断深刻认识,以此指导人们的实践行为,这也是人们对一般事物的认识规律。同样可知,在试验反应为阳性的条件下不患有癌症的后验概率P ( A | B) = 1 -P( A | B) = 1 -0.087 =0.913,比根据以往的调查人群中不患有癌症的先验概率P( A) =0.995要小;相应地,在试验反应为阳性的条件下患有癌症的后验概率P ( A | B ) =0.087比根据以往的调查人群中患有癌症的先验概率 P ( A) =0.005要大,也符合生活直观,这正是被人们认识修正的效果,说明试验反应为阳性与患有癌症这两个事件之间是“互利”关系,也表明医疗设备诊断的必要性。

该题目也表明,在机器检查 “试验反应为阳性”的条件下,确有癌症的正确性检查只有8.7%(即1000 人具有阳性反应的人中大约只有87 人的确患有癌症),所以在机器检查的基础上进行医生诊断也是非常必要的,人们常常喜欢找“有经验”的医生给自己治病,就是因为医生过去的“经验”能帮助医生做出比较准确的诊断,分析导致某个病症出现的最可能的病因,才能起到对症下药,帮助病患解除痛苦的效果。遗憾的是现实中不少医生往往仅凭质量上不完全可靠的机器检查结果武断得出诊断结论,说明提高医疗设备的质量和医生的诊断水平都是提高诊断准确率的重要途径。该题目中还表明,P ( B | )A 与 P ( A | B)是两个不同事件的概率,可能相差很大,该题中前者为0.95,后者只有0.087,应用实践中不能将两者混淆。

全概率公式与贝叶斯公式作为条件概率的重要应用,在解决某些实际生活以及其他领域中具有因果关系的事件的概率问题中起到十分重要的作用。这种因果关系分析可以上升到哲学因果论,先验概率与后验概率在各领域中的应用也可以上升到哲学认识论。

贝叶斯公式还有广泛应用和理论价值,如贝叶斯估计、贝叶斯分析、贝叶斯统计。

推论3 (两事件间的相互作用原理)

此推论的现实应用无处不在,具有某种哲学意义。

4.概率是客观的,还是主观的

在给定条件下,一个事件发生的概率是客观的,是大量重复试验中该事件发生的频率的稳定值,先于试验而存在的一个理论固定值。如果条件发生了变化,某个事件发生的概率可能也会变化,但还是先于试验而存在的一个理论固定值。因而,可以说任何概率都是条件概率,任何概率都是客观存在。

但是,在某几次实际试验或抽样中,某个事件出现的频率是不尽相同的,可变的,与该事件发生的理论概率有差异,只有在大量重复试验中该事件出现的频率将稳定于概率。因此,几率或频率都是概率的估计值,频率可看作是人们对某事件发生的概率的一种估计,是主观的、具体的、可变的,极端估计值的频繁出现会改变人们对某事件发生的可能性大小的认识。正如,一个医生经常误诊,将会降低人们对他医术的信任度。另外,有些概率可以通过试验来验证,但并不是所有的概率都能通过试验来验证的。例如,“对某个危重病人存活3 个月的可能性不超过15%”中的15%,就不是一个可用大量重复试验来加以验证的概率。这种估计来源于医生的医学知识、经验以及对病人病情的了解和趋势估计,多少带有主观性。以上两个方面的概率,常称为主观概率。

频率学派认为概率是客观的,频率是概率的估计,只利用总体的抽样信息直接来估计已知总体中的未知参数,认为参数是客观存在的某个常数。贝叶斯学派认为在某一次或某几次实际试验或抽样中,得到的某事件发生可能性大小的几率是一种抽样信息,先验概率与抽样信息的结合,得到后验概率,后验概率的得到可以改变人们对某事件发生可能性大小的认识,认为参数也是随机变量,应用未知参数的先验分布与总体的抽样信息得到未知参数的后验分布,再利用后验分布做统计推断。频率学派中的先验概率是总体的分布,贝叶斯学派中的先验概率是关于总体参数的先验分布。

频率学派和贝叶斯学派代表两种不同的真理观。频率学派认为本体(即参数)存在且固定,只不过我们看不到罢了, 参数的角色类似于柏拉图的理念。贝叶斯学派则认为,只要是我们没有感知的东西都可以认为是随机的,感知到了新的表象(即观测数据)只是增加对不可知事物(参数)的信念。总的来讲,贝叶斯公式通过先验概率和条件概率的结合,可以综合已有过往人类对一个领域的知识和更新的数据,来不停改进人类的认知,不仅是一种方法论,更是一种世界观。贝叶斯分析的思路对于由证据的积累来推测一个事物发生的概率具有重大作用,当我们要预测一个事物时,我们需要的是首先根据已有的经验和知识推断一个先验概率,然后在新证据不断积累的情况下调整这个概率。通过积累证据来得到一个事件发生概率的整个过程,我们称为贝叶斯分析。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈