在想说明贝叶斯定理这个的时候,想起了大学时老师的一句话“贝叶斯即是由结果找原因",所以在标题中的贝叶斯定理后面特意补充说明了"由果溯因"类型的启发
很多地方,包括一些书和网上都有这个介绍,这里我只是想把这个说清楚点,以便您不和看完后再百度或google,
在提到“由果追溯原因” 这一过程与可能的应用前,有必要了解一下这个定理是怎么回事
1,条件概率
所谓"条件概率"(Conditional probability),就是指在事件B发生的情况下,事件A发生的概率,用P(A|B)来表示。
根据文氏图,可以很清楚地看到在事件B发生的情况下,事件A发生的概率就是P(A∩B)除以P(B)。 (黄色为A交B)
因此,
同理可得,
所以,
即
这就是条件概率的计算公式。
2,贝叶斯推断
对条件概率轮换后得到:
我们把P(A)称为"先验概率"(Prior probability),即在B事件发生之前,我们对A事件概率的一个判断。
P(A|B)称为"后验概率"(Posterior probability),即在B事件发生之后,我们对A事件概率的重新评估。
P(B|A)/P(B)称为"可能性函数"(Likelyhood),这是一个调整因子,使得预估概率更接近真实概率。
所以,条件概率可以理解成下面的式子:
这就是贝叶斯推断。
3,全概率公式
上图为空间S由B1,B2....BN组成
设实验E的样本空间为S,B1,B2,...,Bn为S的一个划分,且P(Bi)>0(i=1,2,...,n),则对任一事件A
这即为全概公式
4,由果追溯原因
从贝叶斯上面的公式我们可以看到, 要想知道某个事件在已知另一事件发生前提下的概率p(B|A),需要分别知道p(A),p(B), p(B|A),这里的主要计算问题在于p(B)
一般其它几项较方便得到(比如词频统计等得到对应的概率); 而这个p(B)的计算需要引入上面的全概公式求解(各项我们也可以方便的得到对应的概率)
至此可以通过贝叶斯求得在某个已知结果的前提下,查看发生事件的最可能原因(亦即最大概率)是哪个
5,应用
邮件过滤,这个提到应用时总被提及
为什么用这个例子呢 ? 再次重申一下由果追溯原因 ,在这个应用中,我们前提是知道邮件中包含了什么词word,然后根据这个词word来判断这是不是一个垃圾邮件
这么看是不是回来了由果溯因的问题上来了,利用公式可以方便的计算对应的概率因而可以作出判断
而我们毕竞不是纯数学,很多时候还要从工程的解度解决问题,所以在对应的概率值上总是找些近似的值,在数学严格的意义条件下总是使假设成立
另外这篇博文目的不是介绍数学公式,只是想通过类似内容是否给予你些启示,例如这个由果溯因类型的问题是否可以考滤用这个定理帮助解决呢?