北京大学生物信息平台论坛

 找回密码
 立即注册
搜索
热搜: 通知 活动

用肿瘤表达谱数据做基因表达的生存分析(及网站)

[复制链接]
licheng 发表于 2016-1-15 00:18:41 | 显示全部楼层 |阅读模式
基因表达的生存分析一般有两种目的:

1、你的生物实验已经找到一个或一组基因,它们影响癌症细胞系或小鼠模型的生长和生存,你想问是否它们在病人样本中也和生存率相关。如果是相关并且表达量和生存率相关的方向与实验一致,就是对实验的临床数据的佐证,可以加大这个研究的临床意义。值得注意是2万个人类基因中随机也会有和生存相关的,尤其在样本量少的时候。这时要用比较严格的p-value或FDR。

2、建立一个分类或预测模型,用多个基因的表达量把样本分成预后生存率有显著有差异的组。一般可以用Cox回归模型(生存分析的主要工具),把传统的临床指标也加到自变量中,找到能帮助预测生存率的独立基因。模型建立后得到的个体预后指数可以把样本分为预后生存率不同的组。最好也用独立数据验证分类能力。如果模型对新病人有预测能力,预后生存率不同的组就可能采取不同的治疗方案——恭喜,你离精准医疗研究已经很近了。

Cox模型简介:http://www.docin.com/touch/detail.do?id=740420236

这两种分析方法都需要病人样本的均一性,比如分期、性别、吸烟历史、接受的治疗方案等,避免找到的基因实际上是这些因素的标记物,而其实是这些因素和生存率相关。在Cox回归中可以把这些因素放在自变量中矫正,找基因时则可以展示每个亚组中这个基因的表达量都和生存相关。

一些公共分析网站如下,可以输入基因名,选择癌症类型后,得到K-M生存曲线图和log rank test显著性。比如按一个基因的表达量高低把病人分成两组,他们的生存曲线是否有显著差异?

TCGA数据的综合分析网站cBioPortal:
http://www.cbioportal.org/index.do

PrognoScan使用有生存数据的公共GEO数据:
http://www.abren.net/PrognoScan/PrognoScan.html


我们组开发的癌症基因组数据分析网站www.canEvolve.org
http://www.ncbi.nlm.nih.gov/pubmed/23418540

ProgGene
http://www.jclinbioinformatics.com/content/3/1/22

基因组生存分析网站的综述:
http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4246473/






回复

使用道具 举报

北京大学生物信息平台论坛

GMT+8, 2017-9-20 04:36 , Processed in 0.073059 second(s), 23 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表