以服务于中国广大创业者为己任,立志于做最好的创业网站。

标签云创业博客联系我们

导航菜单

贝叶斯网络条件概率表,贝叶斯网络

作者:詹姆佐尔诺扎

翻译:李杰

校对:郑子

这篇文章的篇幅是关于3400字,的,所以建议阅读10分钟

本文详细介绍了概念学习中常见的贝叶斯理论。

通过一个简单的例子理解概率的一个基本定理。

这篇文章要求你具备一些概率统计的基础知识。如果你没有,不要害怕。我收集了一系列我能找到的最好的资源来给你介绍这些话题,这样你就可以阅读、理解并充分享受文章的内容。

在这篇文章中,我们将讨论:贝叶斯定理,这是概率论中最著名和最常用的定理之一。从未听说过吗? 那你就有福了! 已经了解了吗? ,接着读下去,用一个简单的例子巩固你的知识,这样你就可以用简单的术语向别人解释。

在未来的文章中,我们将学习贝叶斯定理和其他机器学习概率方法的一些更实用的简化,例如隐马尔可夫模型。

我们开始吧!

概率介绍

在这一部分,我列出了三个优秀简洁的资源(主要是前两个,第三个更广泛),为理解这篇文章提供概率基础。别担心,这些概念很简单。如果你读得快,你肯定能完全理解它们。

如果你已经掌握了基本的概率论,你可以跳过这一部分。

具有简明定义的中等难度文章(https://medium.com/@劳曼纽利克斯/统计学-概率-基础-1-1325ef72f3f)涵盖了理解本文所需的主要概率术语和其他说明性简单示例。机器学习中概率的有趣介绍(http://www.mbmlbook.com/MurderMystery.html)主要通过一个神秘但简单的例子介绍概率的主要术语。哈佛大学统计学110课程(https://project . IQ . Harvard . edu/stat 110/home)。如果你不仅想学习基础知识,还想更好地了解美丽的统计世界,这里有更丰富的资源。好了,现在你可以继续读剩下的,坐下来,放松和享受。

贝叶斯定理

谁是贝叶斯?

托马斯贝叶斯(1701-1761)是英国神学家和数学家,皇家学会(世界上最古老的国家科学学会,也是英国促进科学研究的主要国家组织)成员。其他科学家加入了皇家学会,如牛顿、达尔文和法拉第。他提出了一个最重要的概率定理,并以他的名字命名:贝叶斯定理

ndex="0">条件概率定理。


尊敬的托马斯·贝叶斯的画像,贝叶斯定理之父


定理:条件概率


为了解释这个定理,我们将举一个非常简单的例子。假设你被诊断出患有非常罕见的疾病,这种病患的比例仅是人口的0.1%, 即每千人中有1人。


你参加的检查这种疾病的检测能正确地找出99%的患者,将健康的人错误分类的几率只有1%。


真是命中注定!医生,这种病会致命吗?


大多数人都会这么问。然而,在这次测试之后,我们真正患这种疾病的几率有多大呢?


99%!可以开始整理我的遗物了。


基于这种想法,贝叶斯思想应该占上风,因为它实际上离真实值非常遥远。让我们用贝叶斯定理来获得一些观点。


贝叶斯定理,或之前所说的条件概率定理,是用来计算某一事件(E)已经发生(例如在测试中被诊断为阳性)时假设(H)为真的概率。计算公式如下:


贝叶斯的条件概率公式


等号左边的P(H|E)项是已经在疾病测试中诊断为阳性(E)的条件下患病(H)的概率,这是我们实际想要计算的。概率项中的竖线(|)表示条件概率(即, B的条件下A的概率表示为P(A|B))。


假如假设为真,则右边分子的左项P(E|H)是事件的概率。在示例中,就是我们患有这种疾病的情况下,在测试中被诊断为阳性的可能性。


旁边的P(H)项是在任何事件发生之前假设的先验概率。这是在进行任何检查之前患上疾病的可能性。


最后,分母上的P(E)项是事件的概率,即被诊断为疾病阳性的概率。该项可以进一步分解为两个较小项的和:患病且检测为阳性和不患病且检测为阳性。


解构了测试结果为阳性的概率


在这个公式中,P(H)表示没有疾病的先验概率,其中表示否定。 下图描述了条件概率的整体计算中涉及的每一项:


描述贝叶斯定理公式所涉及的每一项


对于我们来说,请记住,假设H患有疾病,事件E为在此类疾病的测试中被诊断为阳性。


如果使用我们见过的第一个公式(用于计算患病并被诊断为阳性的条件概率的完整公式),分解分母并插入数字,我们将得到以下算式:


条件概率的计算


0.99来自于有疾病被诊断出阳性的概率99%,0.001是患病的几率1/1000,0.999是未患病的概率,0.01是即使没有患病也被诊断为阳性的可能性。计算的最终结果是:


计算结果


9% !我们得这种病的几率只有9% !“这怎么可能呢?”你可能在问自己。魔法吗?不,我的朋友们,这不是魔法,这只是概率:应用数学的常识。像丹尼尔卡尼曼(Daniel Kahneman)在《思考,快与慢》中所描述的那样,人的大脑很难估计和计算概率,就像前面的示例所展示的一样,所以我们应该警惕直觉的惯性思考,后退一步,使用所能用的概率工具。


现在想象一下,在第一次测试被诊断为阳性后,我们决定在另一个不同的诊所做另一次相同条件的测试来复查结果,不幸的是我们再次得到了阳性的诊断,这说明第二次测试也表明我们患有这种疾病。


现在患病的实际概率是多少?我们可以使用与之前完全相同的公式,只是将最初的先验概率(患病几率为0.1%)替换为之前的后验概率(在一次检测中被诊断为阳性的几率为9%),以及其他项。


如果我们处理得到的数字:


计算第二次检验为阳性后的条件概率


第二次检验为阳性的结果


现在我们实际患此病的几率变高了,为91%。尽管情况看起来很糟糕,但在两次检测呈阳性后,我们仍然不能完全确定我们是否患有这种疾病。确定性似乎不存在于概率的世界。


定理背后的事实


这个著名定理背后的事实是,我们永远不可能完全确定这个世界,因为它是一个不断变化的存在,变化是现实的本质。然而,我们可以做的是,就像这个定理所表达的,随着我们获得越来越多的数据或证据,我们对现实的认识有了更新和提高。


这可以用一个非常简单的例子来说明。想象一下这样的情景:你在一个方形的花园边缘,坐在椅子上,朝花园外看。在对面,躺着一个仆人,他把一个蓝色的球扔进了广场。在那之后,他不断地把其他黄色的球扔进正方形,并告诉你它们相对于最初的蓝球的位置。


随着越来越多的黄球落地, 并且你知道它们相对于第一个蓝球的落地位置,逐渐增多了对蓝球的可能位置的了解,而排除了花园的某些部分:随着我们获得更多证据(更多的黄球)我们更新了知识(蓝球的位置)。


在上面的示例中,仅抛出了三个黄球,我们已经可以开始确定某个想法,即蓝球位于花园左上角的某个位置。


当贝叶斯第一次提出该定理时,他并没有一开始就发表它,他认为这没有什么特别的,这个定理所在的论文是在他死后发现的。


如今,贝叶斯定理不仅是现代概率的基础之一,还在智能系统中使用繁多,例如垃圾邮件过滤器、文本处理,甚至于与文本处理无关的场景。


在下一篇文章中,我们将看到这些应用是什么,以及贝叶斯定理及其变体如何应用于许多实际用例。如果你想看,请关注我的频道,并保持关注!


就这些,我希望你喜欢这个帖子。你可以在LinkedIn上和我联系,或者在Twitter上关注我@jaimezorno。另外,你也可以看看我其他关于数据科学和机器学习的文章。祝你阅读愉快!


原文标题:


Probability Learning I: Bayes’ Theorem


原文链接:


https://www.kdnuggets.com/2019/10/probability-learning-bayes-theorem.html


编辑:王菁


校对:洪舒越


译者简介


李洁,香港科技大学电信学硕士毕业生,现任北京师范大学香港浸会大学联合学院 数据科学系助教。喜欢数据科学,喜欢阅读,喜欢研究代码和做手工。希望一直保持学习的状态和对生活的热爱,每天都快乐而有进步~


— 完 —


关注清华-青岛数据科学研究院官方微信公众平台“THU数据派”及姊妹号“数据派THU”获取更多讲座福利及优质内容。