2.4 条件概率
![2017_09_19_110428 2017_09_19_110428](https://yqfile.alicdn.com/1b2c31f5b63e984815c7522afa220d99f784e03f.png)
图2-5 条件概率x和y的联合概率密度函数以及两个条件概率分布Pr(xy=y1)和Pr(xy=y2)。通过从联合概率密度函数中提取切片并规范化,确保区域一致。同样的操作也适用于离散分布给定y取y
时x的条件概率,是随机变量x在y取固定值y时x的相对概率的取值。这个条件概率记为Pr(xy=y*)。“”可以理解为“给定”。
条件概率Pr(xy=y
)可以由联合分布Pr(x,y)计算出来。特别是,计算联合分布中某个恰当的切片Pr(x,y=y)(见图2-5)。切片值表示出当y=y*时x取不同值的相对概率,但其本身没有形成有效的概率分布。因为它们仅构成联合分布的一小部分,其总和不会是1,而联合概率自身总和为1。为计算条件概率分布,因此需要规范化切片中的总概率
其中,使用边缘概率关系式(式(2-1))去简化分母。通常情况下不会显式定义y=y*,所以条件概率关系式可简化缩写为:
![2017_09_19_110943 2017_09_19_110943](https://yqfile.alicdn.com/7bd4f3e31e1c324c24bb4ce38d41f66387e086f4.png)
重新整理得到:
![2017_09_19_111155 2017_09_19_111155](https://yqfile.alicdn.com/19b4fdd061f333fed56b54ccfa14429b90398a70.png)
由对称性也可得:
![2017_09_19_111229 2017_09_19_111229](https://yqfile.alicdn.com/a5832ca6a4cab6644f3219a9fb3d73d1cae76820.png)
当有两个以上的变量时,可以不断用条件概率分布将联合概率分布分解为乘积形式: