Quantcast
Channel: CSDN博客推荐文章
Viewing all articles
Browse latest Browse all 35570

贝叶斯定理-----"由果溯因"类型问题的启发

$
0
0

在想说明贝叶斯定理这个的时候,想起了大学时老师的一句话“贝叶斯即是由结果找原因",所以在标题中的贝叶斯定理后面特意补充说明了"由果溯因"类型的启发


很多地方,包括一些书和网上都有这个介绍,这里我只是想把这个说清楚点,以便您不和看完后再百度或google,


在提到“由果追溯原因” 这一过程与可能的应用前,有必要了解一下这个定理是怎么回事


1,条件概率

所谓"条件概率"(Conditional probability),就是指在事件B发生的情况下,事件A发生的概率,用P(A|B)来表示。



根据文氏图,可以很清楚地看到在事件B发生的情况下,事件A发生的概率就是P(A∩B)除以P(B)。  (黄色为A交B)

因此,

同理可得,

所以,

这就是条件概率的计算公式。


2,贝叶斯推断


对条件概率轮换后得到:

我们把P(A)称为"先验概率"(Prior probability),即在B事件发生之前,我们对A事件概率的一个判断。

P(A|B)称为"后验概率"(Posterior probability),即在B事件发生之后,我们对A事件概率的重新评估。

P(B|A)/P(B)称为"可能性函数"(Likelyhood),这是一个调整因子,使得预估概率更接近真实概率。

所以,条件概率可以理解成下面的式子:

\mbox{Posterior probability} \propto \mbox{Prior probability} \times \mbox{Likelihood}

这就是贝叶斯推断。


3,全概率公式

上图为空间S由B1,B2....BN组成


设实验E的样本空间为S,B1,B2,...,Bn为S的一个划分,且P(Bi)>0(i=1,2,...,n),则对任一事件A

P(A)=P(A|B1)*P(B1) + P(A|B2)*P(B2) + ... + P(A|Bn)*P(Bn).
这即为全概公式

4,由果追溯原因

从贝叶斯上面的公式我们可以看到, 要想知道某个事件在已知另一事件发生前提下的概率p(B|A),需要分别知道p(A),p(B), p(B|A),这里的主要计算问题在于p(B)

一般其它几项较方便得到(比如词频统计等得到对应的概率); 而这个p(B)的计算需要引入上面的全概公式求解(各项我们也可以方便的得到对应的概率)


至此可以通过贝叶斯求得在某个已知结果的前提下,查看发生事件的最可能原因(亦即最大概率)是哪个


5,应用

邮件过滤,这个提到应用时总被提及

为什么用这个例子呢 ? 再次重申一下由果追溯原因 ,在这个应用中,我们前提是知道邮件中包含了什么词word,然后根据这个词word来判断这是不是一个垃圾邮件

这么看是不是回来了由果溯因的问题上来了,利用公式可以方便的计算对应的概率因而可以作出判断


而我们毕竞不是纯数学,很多时候还要从工程的解度解决问题,所以在对应的概率值上总是找些近似的值,在数学严格的意义条件下总是使假设成立


另外这篇博文目的不是介绍数学公式,只是想通过类似内容是否给予你些启示,例如这个由果溯因类型的问题是否可以考滤用这个定理帮助解决呢?









作者:timegoesby001 发表于2013-12-8 1:14:40 原文链接
阅读:208 评论:0 查看评论

Viewing all articles
Browse latest Browse all 35570

Trending Articles



<script src="https://jsc.adskeeper.com/r/s/rssing.com.1596347.js" async> </script>