北京大学生物信息平台论坛

 找回密码
 立即注册
搜索
热搜: 通知 活动

【统计急转湾】假设一种疾病的发病率是万分之一

[复制链接]
licheng 发表于 2016-4-12 22:49:04 | 显示全部楼层 |阅读模式
【统计急转湾】假设一种疾病的发病率是万分之一,检查这种疾病的化验准确率是99%(假阳率和假阴率都是1%)。如果一个人化验后被预测得了疾病,他应该担心吗,为什么?

【雷芷芯】追加题:此人再化验一次是阳性,确实得病的概率又是多少?
回复

使用道具 举报

 楼主| licheng 发表于 2016-4-12 23:16:54 | 显示全部楼层
【用贝叶斯公式回答,by 郑昱豪】
IMG_20160412_232214.jpg

【朋泽】这个结论其实也不是很反直觉,这里的问题主要还是整体的发病率很低,所以即使检测呈阳性他的后验患病概率也仍然较低。但相比于检测呈阴性的人来说,检测呈阳性预示着患病概率提高了近100倍,这才是这个检测的意义。

【Cheng】如果把B看成是新的信息data,P(A|data)= P(A,data)|P(data)= P(A)* P(data|A)/P(data),A这里是实际患病或不患病,一般可以是任何想预测的类别,P(data)是常数,对每个A都一样,可以不计算实际值。公式即变为:P(A|data)~ P(A)* P(data|A),对不同的A看这个条件概率的相对比例即可,所有A的条件概率相加为1。

这个公式就是贝叶斯概率更新的原理,可以理解为:来了新数据data后,A的后验概率是A的先验概率乘以A的似然性(liklihood,P(data|A))。这个后验概率可以类似作为先验概率,等再来新数据时更新条件概率。


【Cheng】@雷芷芯 好问题,如果两次化验独立,两个一万人中随机100人的假阳集合的交集约是1,几乎能锁定真正的病人了?按朋泽的分析,患病概率又提高一百倍,接近1?

从预测模型上看,如果能建立多个独立(如所用特征)的预测模型,它们预测阳性的交集的假阳性会大大降低?

难点是:1、得到99%准确率的预测模型,2、得到两个或更多的独立(如所用特征)的这样的模型。化验检测独立性容易(不同医院、不同试剂盒),从同一批数据建立多个独立预测模型比较难?

【预测目标讨论,Cheng】假设疾病的发病率是万分之一,我们开发出一种预测模型的准确率是99%(假阳率和假阴率都是1%)。对人群中随机一万人应用这个模型,其中的一个病人被检验出的概率是99%,但其余人中有100人也因为假阳性被预测是病人。

我们是否对这101预测为阳性的人做深度筛查,以便找出这一个真正的病人?对这101人来说,他们整体的患病概率是1%,提高了100倍,值得深度筛查。但是深度筛查是否有操作和经济可行性?

更可能的情况是我们模型的准确率是90%,比如假阳率和假阴率都是10%。那一万人会预测出一千病人,其中只有一人是真正病人(他们的患病概率是千分之一)。这时对一千人进行深度筛查,以找到这一个真正病人是否有可行性?可行性从哪些方面怎么来判断?





回复 支持 反对

使用道具 举报

北京大学生物信息平台论坛

GMT+8, 2017-11-18 20:13 , Processed in 0.090890 second(s), 25 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表