天才一秒记住【畅想小说网】地址:http://www.cxtra.net
P(AB)=P(A|B)P(B)=P(B|A)P(A)
结合这几个公式,可以得到贝叶斯公式,形式如下。
它的意义在于可以通过改变条件和随机事件的相对位置来计算所需的条件概率,即可以通过事件A在事件B发生的条件下的概率计算事件B在事件A发生的条件下的概率。
可以通过下面的例子体会这种转换的意义。
日常生活中听到的天气预报,经常是这样描述天气:“明天的降水概率为80%。”
这是如何做到的呢?在对明天的天气进行预测时,我们不可能通过计算频率(把明天重复100次),发现其中大约有80次下雨,从而预测出明天的降水概率为80%。
实际上,我们是通过仪器测量气象数据(如温度、湿度、风力等)计算在这些气象条件(A)下,明天降水(B)的概率。
而这个条件概率,就可以使用贝叶斯公式,利用已经记录在案的历史天气数据来计算。
为了进一步熟悉贝叶斯公式的使用方法,下面以疾病检测作为例子进行具体地计算。
设某种疾病在人群中的患病率是0.5%,现通过一种检测试剂对这种疾病的患者进行筛查。
如果已知真正的患者用这种试剂检测呈阳性的概率为99%,未患病的人试剂检测呈阴性的概率为98%,那么检测结果呈阳性的人患病的概率为多少呢?
P(B)=0.005
依据例中给出的说明,可知
P(A|B)=0.99
在计算P(A)时需要用到另一个概率中的重要公式——全概率公式。
因为在贝叶斯分类算法中其实并不需要真正计算出概率P(A),所以不再详细说明全概率公式的含义,而是直接给出它的表达式
P(A)=P(A|B)P(B)+P(A|B)P(B)
其中B表示B的对立事件,即没有患病。
按照这个公式通过计算可得
P(A)=0.02485
最终,把这些计算结果代入贝叶斯公式,可以算出检测结果呈阳性的人患病的概率为19.9%。
由上例中给出的已知条件可以看出,无论是患者检测呈阳性还是未患病的人检测呈阴性的概率都很高,看起来通过这种试剂检测该病患者的准确率应该也很高。
但是通过贝叶斯公式的计算结果可以看出,实际上检测结果为阳性的人真正患有这种疾病的概率并不是特别高,只有不到20%。
有80%检测结果呈阳性的人其实并未患病,这在医学上称为假阳性。
这个例子其实给出了科学评价医学检测手段的准确性的一种方法。
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!