大大大大大大 大 大大大大大大大 大 统 大大大大大大大大大大 大大大大大大大大大大大大大大 2004-2005 大大大大大大 大大大大 2005.4.18
Jan 21, 2016
大学文科数学之
线性代数与概率统计
北京师范大学珠海分校国际特许经营学院与不动产学院
2004-2005 学年第二学期欧阳顺湘 2005.4.18
第三讲 条件概率及相关 条件概率 独立事件 全概率公式 贝叶斯公式
条件概率 引言 一个随机试验往往包含着多个随机事件 , 研究随机事件的之间的关系以及相关的概率
是自然的 . 下面我们就来讨论已知一个事件发生时另一
个事件发生的条件概率和事件之间的相互独立性
人们对一个事件发生的可能性大小的评价往往依赖于所获取的信息 . 例如 ,
如果已知在一夏日某地下雨了 , 则该地气温下降的的概率将增大 ;
如果投掷一颗均匀的骰子 , 并被告知所得点数为偶数 , 则你得到 1 点的概率显然是 0.
条件概率 : 记号 我们将这种已知事件 A 发生的条件下事件 B
发生的概率记为 P(B|A), 这个概率也常简称为给定 A 时 B 发生的条
件概率 怎样计算 ( 定义 )P(B|A) 呢 ? 我们先来分析一下下面的两个问题
问题 1 在一个盒子中装有 5 个白球和5 个彩球 : 3 个红球和 2 个蓝球 .
现从中任意取出一个球 , 求取出红球的概率 .
如果已知取出的球是彩色的 , 那么 , 取出红球的概率又是多少呢 ?
分析理解 用 A 表示取出彩球 , 用 B 表示取出红球 . 从这盒子中任取一球共有 10 种等可能的取
法 ; 其中有 3 种取法使取出的球的为红色 . 因此 , 从这 10 个球中取得一个红球的概率为 P(B)=3/10
如果已知 A 发生 , 即已知取的得球是彩色的 , 则从盒子中任取一球只有 5 种可能的情形 : 取 3 个红球或 2 个蓝球中的某一个 ;
其中有 3 种取出红球 (B 发生 ) 的方法 . 由此可知 , 这时取得红球的概率为
P(B|A)=3/5 由此可见 , 已知 A 发生的条件下 B 发
生的概率 P(B|A) 一般不同于 `` 无条件“时 B 发生的概率 P(B).
由于盒子中的 10 个球中有5个彩球 , 易知从中取出彩球,即 A 发生的概率为 P(A)=5/10.
A, B 同时发生指的是取出的球既是彩球又是红球,或说取出的球是红色的,即事件 B 发生了 .
因此, A, B 同时发生的概率为 P(AB)=P(B)=3/10. 将 P(B|A) 的值 3/5 的分子、分母同除以 10,
并利用上述计算结果,我们可以注意到给定A 时 B 发生的条件概率可以写成
抽象概括 条件概率的定义
问题 随机地选择一个有两个孩子的家庭 , 并假定
生男孩和生女孩是等可能的 . 如果已知 A: 其中一个孩子是女孩 , 求 B:
另一个孩子是男孩的概率 . 如果从性别的等可能性来考虑 , 你可能很快
就回答说答案是 1/2. 这是否正确呢 ?
设 A:= {有一个孩子是女孩 } B:= {有一个孩子是男孩 } 则所求得概率为 P(B|A) P(B|A)=P(AB)/P(A) 按照出生顺序 , 这个家庭的两个孩子共
有如下 4 种等可能的情形 : 男男 , 男女 , 女男 , 女女 .
这个家庭中有一个女孩 , 即事件 A 包含如下3 种可能的情形 :
男女 女男 女女 (A) P(A)=3/4 而该家庭中有一个男孩 , 即事件 B 则包含如
下 3 种可能的情形 : 男男 男女 女男 (B) 家庭中既有一个男孩又有一个女孩的可能情
形为 男女 女男 (AB) P(AB)=2/4
乘法公式 P(AB)=? P(B|A)=P(AB)/P(A) P(AB) =P(A)P(B|A) (P(A)>0) 一般地, P(A1A2A3)=?
乘法公式 应用 例 某工厂有一批零件共 100 个 , 其中有 1
0 个次品 , 从这批零件中随机抽两次 , 每次抽取一件 , 取后不放回 , 求两次都取到正品的概率 .
用 Ai表示第 i 次 ( i =1, 2) 取到正品,即 用 A1 表示第 1 次取到正品 用 A2 表示第 2 次取到正品 P(A1A2)=? P(A1A2)=P(A1)P(A2|A1)=?
独立事件课堂练习 : 掷一枚均匀的硬币两次 , 用 A 表示第一次正面朝上 , B 表示第二次正面朝上 , 求 P(B|A).
分析 : P(B|A) 是 A 发生的条件下 B 发生的概率 , 但 A 是第一次掷得的结果 , B 是第二次掷
得的结果 , 这前后两次之间能有什么影响呢 ? 直觉告诉我们 , A 已发生的信息不会改变 B
发生的概率 , 应有 P(B)=P(B|A). 我们下面认真地算一下 P(B) 和 P(B|A), 看看我们的猜测是否正确 .
掷一枚均匀的硬币两次 , 共有如下 4 种等可能的情形 正正 , 正反 , 反正 , 反反 . A 发生 , 即第一次掷得正面朝上可能结果 : 正正 , 正反 . 因此 , P(A)=2/4=1/2. B 发生 , 即第二次掷得正面朝上可能是 正正 , 反正 . 因此 , P(B)=2/4=1/2. 我们还可以看到 A, B 同时发生的情形只有一种 : 正正 . 因此 P(AB)=1/4. 由条件概率的计算公式可知
独立事件 一般而言,条件概率 P(B|A) 不等于绝
对概率 P(B), 如果 P(B|A)=P(B), 则这意味着事件 A 已发生的知识不能影响我们对事件 B 发生的推测 .
这时我们称 A 独立于 B
独立是相互的 A 独立于 B P(B|A)=P(B) P(AB)=P(A)P(B) ( + P(B)>0 ) P(A|B)=P(A) B 独立于 A
B=P(A)[1- P(B)]= P(A) P( )
= P(A)- P(AB)
BP(A )= P(A - A B)
A 、 B 独立
故 A 与 独立 . B
概率的性质
= P(A)- P(A) P(B)
证明 : 仅证 A 与 独立B
容易证明 ,若两事件 A 、 B 独立,则 BABABA 与与与 ,, 也相互独立 .
多个事件的独立性
多个事件的独立性
将两事件独立的定义推广到三个事件:
对于三个事件 A 、 B 、 C ,若
P(AB)= P(A)P(B) 四个等式同时
P(AC)= P(A)P(C) 成立 , 则称事件
P(BC)= P(B)P(C) A 、 B 、 C 相互
P(ABC)= P(A)P(B)P(C) 独立 .
推广到 n 个事件的独立性定义 , 可类似写出:
包含等式总数为:
1201
)11(
32
nnn
n
nnn
nn
设 A1,A2, …,An 是 n 个事件,如果对任意 k
(1<k n), 任意 1 i1<i2< …<ik n,具有等式
则称 A1,A2, …,An 为相互独立的事件 .
) ( ) ( ) ( ) (2 1 2 1k ki i i i i iA P A P A P A A A P
请注意多个事件两两独立与相互独立的区别与联系
两两独立相互独立
对 n(n>2) 个事件
?
在实际应用中 , 往往根据问题的实际意义去判断两事件是否独立 .
由于“甲命中”并不影响“乙命中”的概率,故认为 A 、 B 独立 .
甲、乙两人向同一目标射击,记 A={甲命中 }, B={乙命中 } , A 与 B 是否独立?
例如
(即一事件发生与否并不影响另一事件发生 的概率)
应用例 有三名队员彼此独立地向同一目标射击,集中率分别为 0.9, 0.8, 0.7, 求目标被击中的概率
Ai: 第 i人击中目标 B: 目标被击中 B: 至少有一人击中目标 B=A1+A2+A3 Ω\B= Ω\(A1+A2+A3)= P(B)=1 – P(Ω\B)=
概率论在法庭上的应用
全概率公式和贝叶斯公式 主要用于计算比较复杂事件的概率 , 它
们实质上是加法公式和乘法公式的综合运用 .
综合运用
加法公式P(A+B)=P(A)+P(B)
A 、 B 互斥
乘法公式P(AB)= P(A)P(B|A)
P(A)>0
全概率公式 与 应用例 完备事件组 与 事件的分解 公式(特例) 应用 一般公式
完备事件组 与 事件的分解 设 A1 、 A2 、 A3 满足 : 两两互斥:当 i<>j , AiAj=Φ;且 A1+A2+A3= Ω
B=BΩ=B(A1+A2+A3)=BA1+BA2+BA3
全概率公式 B= A1B+A2B+A3B , A1B 、 A2B 、 A3B 两两互斥 P(B)=P( A1B)+P(A2B)+P(A3B)
3
1iii ABPAPBP )()()( |
应用例 根据某地气象和地震资料知:大旱年、大涝
年、正常年的概率分别为 0.6, 0.3 , 0.4, 求当地有地震的概率
设 B: 有地震 ( 求 P(B) ) A1 A2 A3 分别表示 大旱年、大涝年、正常年
3
1iii ABPAPBP )()()( |
例 10 自学
一般公式
设 Ω 为随机试验的样本空间, A1,A2,…,An
是两两互斥的事件,且有 P(Ai)>0 , i =1,2,…,
n,
n
iii ABPAPBP
1
)()()( |
全概率公式 :
称满足上述条件的 A1,A2,…,An 为完备事件组 .
1
,n
ii
A
则对任一事件 B ,有
在较复杂情况下直接计算 P(B) 不易 ,但 B
总是伴随着某个 Ai 出现,适当地去构造这一组 Ai 往往可以简化计算 .
n
iii ABPAPBP
1
)()()( |
全概率公式的来由 , 不难由上式看出 :
“ 全”部概率 P(B) 被分解成了许多部分之和 .
它的理论和实用意义在于 :
某一事件 B 的发生有各种可能的原因 (i=
1,2,…,n) ,如果 B 是由原因 Ai 所引起,则B 发生的概率是
每一原因都可能导致 B 发生,故 B 发生的概率是各原因引起 B 发生概率的总和,即全概率公式 .
P(BAi)=P(Ai)P(B |Ai)
全概率公式 .我们还可以从另一个角度去理解
贝叶斯公式
该球取自哪号箱的可能性最大 ?
实际中还有下面一类问题,是“ 已知结果求原因”
这一类问题在实际中更为常见,它所求的是条件概率,是已知某结果发生条件下,求各原因发生可能性大小 .
某人从任一箱中任意摸出一球,发现是红球 ,求该球是取自 1 号箱的概率 .
1 2 3
1 红 4 白或者问 :
接下来我们介绍为解决这类问题而引出的
贝叶斯公式
有三个箱子,分别编号为 1,2,3 , 1 号箱装有 1 个红球 4 个白球, 2 号箱装有 2 红球 3
白球, 3 号箱装有 3 红球 . 某人从三箱中任取一箱,从中任意摸出一球,发现是红球 , 求该球是取自 1 号箱的概率 .
1 2 3
1 红 4 白
?
某人从任一箱中任意摸出一球,发现是红球,求该球是取自 1 号箱的概率 .
)(
)()|( 1
1 BP
BAPBAP
记 Ai={ 球取自 i 号箱 }, i=1,2
,3; B ={ 取得红球 }求 P(A1|B)
3
1
11
kkk ABPAP
ABPAP
)()(
)|()(
|运用全概率公式
计算 P(B)
将这里得到的公式一般化,就得到贝叶斯公式
1 2 3
1 红 4 白
?
n
jjjiii ABPAPABPAPBAP
1
)()()()()|( ||
该公式于 1763 年由贝叶斯 (Bayes) 给出 . 它是在观察到事件 B 已发生的条件下,寻找导致 B 发生的每个原因的概率 .
贝叶斯公式:
设 A1,A2,…,An 是两两互斥的事件,且 P(Ai)>0 , i=1,2,…,n, 另有一事件 B ,它总是与 A1
,A2,…,An 之一同时发生,则
ni ,,, 21
贝叶斯公式在实际中有很多应用,它可以帮助人们确定某结果(事件 B)发生的最可能原因 .
例 3 某一地区患有癌症的人占 0.005 ,患者对一种试验反应是阳性的概率为 0.95 ,正常人对这种试验反应是阳性的概率为 0.04 ,现抽查了一个人,试验反应是阳性,问此人是癌症患者的概率有多大 ?
则 表示“抽查的人不患癌症” . C
CC
已知 P(C)=0.005,P( )=0.995, P(A|C)=0.95, P(A| )=0.04
求解如下 : 设 C={ 抽查的人患有癌症 } , A={ 试验结果是阳性 } ,
求 P(C|A).
现在来分析一下结果的意义 .
由贝叶斯公式,可得
)|()()|()(
)|()()|(
CAPCPCAPCP
CAPCPACP
代入数据计算得 : P(C| A)= 0.1066
2. 检出阳性是否一定患有癌症 ?
1. 这种试验对于诊断一个人是否患有癌症 有无意义?
如果不做试验 , 抽查一人 ,他是患者的概率 P(C)=0.005
患者阳性反应的概率是 0.95 ,若试验后得阳性反应,则根据试验得来的信息,此人是患者的概率为 P(C| A)= 0.1066
说明这种试验对于诊断一个人是否患有癌症有意义 .
从 0.005 增加到 0.1066, 将近增加约 21倍 .
1. 这种试验对于诊断一个人是否患有癌症 有无意义?
2. 检出阳性是否一定患有癌症 ?
试验结果为阳性 , 此人确患癌症的概率为 P(C| A)=0.1066
即使你检出阳性,尚可不必过早下结论你有癌症,这种可能性只有 10.66% (平均来说, 1000 个人中大约只有 107 人确患癌症 ) ,此时医生常要通过再试验来确认 .
下面我们再回过头来看一下贝叶斯公式
n
jii
iii
ABPAP
ABPAPBAP
1
)()(
)()()|(
|
|贝叶斯公式
在贝叶斯公式中, P(Ai) 和 P(Ai |B) 分别称为原因的验前概率和验后概率 .P(Ai)(i=1,2,…,n) 是在没有进一步信息(不知道事件 B 是否发生)的情况下,人们对诸事件发生可能性大小的认识 .
当有了新的信息(知道 B 发生),人们对诸事件发生可能性大小 P(Ai | B) 有了新的估
计 .
贝叶斯公式从数量上刻划了这种变化。
在不了解案情细节 ( 事件B)之前,侦破人员根据过去的前科,对他们作案的可能性有一个估计,设为
比如原来认为作案可能性较小的某甲,现在变成了重点嫌疑犯 .
例如,某地发生了一个案件,怀疑对象有甲、乙、丙三人 .
甲乙丙P(A1) P(A2) P(A3)
但在知道案情细节后 , 这个估计就有了变化 . P(A1 | B)
知道 B发生后
P(A2 | B) P(A3 | B)
最大
偏小
这一讲我们介绍了
全概率公式 贝叶斯公式
它们是加法公式和乘法公式的综合运用 ,
同学们可通过进一步的练习去掌握它们 .
值得一提的是,后来的学者依据贝叶斯公式的思想发展了一整套统计推断方法,叫作“贝叶斯统计” . 可见贝叶斯公式的影响 .
练习 Page 153 4, 5