北京大学生物信息平台论坛

 找回密码
 立即注册
搜索
热搜: 通知 活动

【简单图】基因集合的功能富集、通路和网络图

[复制链接]
licheng 发表于 2016-4-10 21:47:49 | 显示全部楼层 |阅读模式
点击这里看本页的图。

用组学数据得到一个差异表达的基因集合后,常用的后续分析是看集合中富集了哪些功能或生物通路。文献和课题中常能看到这样的gene ontology(GO)富集图: ijms-15-18422-g004-1024.png
优点是它是个图,比包含相同信息的表能更直观快速地传达信息。缺点是:

1、许多富集的GO term含义比较广泛,如transcription, cell cycle,不能帮助更好地理解研究问题。这是因为针对2x2列联表的统计检验,如Fisher's test、Chi-square test,如果把列联表的四个数都乘以10,富集比例不变,但p-value会变显著。含义广泛的GO term包含的基因数多,它们就容易得到显著的p-value。

2、GO terms组成一个类似树状的关系图,terms沿树根到枝叶是从广义到特异的关系,在树中近的GO terms含义相关,也包含许多共同的基因,所以富集结果中会看到相关的GO terms富集。

3、图比较朴素,不太吸引人看。

数十种功能或通路富集软件我们难以一一学习,快捷的办法是在搜索引擎中搜索gene ontology analysis, pathway enrichment这样的关键词,然后点击图片搜索的结果。看到新颖的、符合自己数据或问题的图,再点击看相关文献或网站看看图是怎么做出来的。一些改进富集分析的思路:

1、把GO term的关系树画出来,富集的程度用颜色表示,很直观地看到相邻term的富集程度的渐变:
Figure-7-Analysis-of-gene-ontology-GO-term-enrichment-of-biological-processes.png
也可以用圆的大小表示GO term包含的基因个数(见下)。Cheng's plotting rule 2:用点的颜色、大小表示第三、第四个维度的信息。

ng.740-F3.jpg

2、把在感兴趣的或富集分析得到的生物通路的KEGG图中,用颜色标出基因表达的变化,帮助看到变化的节点或通路分支:
1752-0509-8-68-S4.png
3、相比GO terms,生物通路数量少一些,相互也更独立些,所以可以用热图展示多个通路、多个时间点中上调和下调基因的富集情况。我们也预期通路的富集程度是随时间渐变的:
IMG_20160410_235054.jpg 这里每行是不同通路,每列是时间点(除0时间),颜色表示这个时间点和0时间相比,差异表达的基因在通路中的富集-log10(p-value),红色是上调基因富集,蓝色是下调基因富集,也可用上下三角分别画红蓝。


4、进阶的方法是基因网络分析,可能帮你的文章加IF分,你也能说自己在做网络生物学、系统生物学或生物大数据了。网络的节点是基因、非编码基因或蛋白质,节点间的连接可以是转录因子/miRNA—靶基因、蛋白相互作用、基因共表达、三维基因组中的接近程度等。Cytoscape是常用的网络绘图软件。简单的图可以把基因表达变化作为节点的颜色,帮助看出miRNA和调控基因的表达负相关:
F3.large.jpg
复杂的图很好看,但可能信息量不大:
F4.large.jpg
如何找到平衡,是经验也是艺术:
nmeth.2016-F4.jpg
(图片来自网络搜索,谢谢原作者)

(微信公众号:wegenome)

回复

使用道具 举报

北京大学生物信息平台论坛

GMT+8, 2017-11-24 15:24 , Processed in 0.091546 second(s), 30 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表