北京大学生物信息平台论坛

 找回密码
 立即注册
搜索
热搜: 通知 活动

把数据画在基因组染色体图谱上

[复制链接]
licheng 发表于 2016-3-8 09:27:41 | 显示全部楼层 |阅读模式
From: Cheng Li
Date: 2014-11-27 23:20 GMT+08:00
Subject: 分析技术

1. 基因组学的一个常用画图是把数据在基因组染色体图上呈现出来,如朋泽今晚讲的Samur 2013论文(Figure 3)。

2. 仅用表达谱数据,能不能推测或画图看出大区域的拷贝数变化?这个分析叫做expression-based karyotyping ([url=]http://www.ncbi.nlm.nih.gov/pubmed/23619890)[/url] ,见附件的e-Karyotype.zip的更多文献。它的原理是大区域的拷贝数变化会影响其中的许多基因表达变化,去除表达谱噪音后能看到相应拷贝数变化的区域。

3. 附件的BMC 2013论文用四种非整倍体的iPSC和整倍体iPSC(诱导多功能干细胞)比较RNA-seq表达谱,包括X单体、8、13、22号三体,发现所有 染色体上都有很多基因有差异表达(Figure 5),尤其奇怪的是22号三体的细胞在3号染色体有很多下调基因,而8号三体细胞在10号染色体有很多上调基因。作者的结论是一条三体染色体可以造 成全基因组的表达谱变化。我觉得可能是他们做分析时没有过滤低表达或没有表达的基因(Table 1B),让随机的噪音影响了分析结果。另外他们的细胞系是从其他实验室得到的,没有检查染色体核型。作者最后对每个细胞系中差异表达的基因做通路富集分析 (Figure 6),发现神经元发育和癌症通路富集,这和三体疾病会影响脑发育和加大癌症风险吻合。使用iPSC细胞是因为它更接近胚胎早期发育,如果用病人的成纤维 细胞就可能看不到神经通路的变化。

4. 感兴趣的同学可以下载3)的数据(http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE49247)练习分析或发展课题思路。用2)的方法检查核型是否匹配相应的三体染色体;重复文中的图表;或收集更多的三体表达谱数据做整合分析。




【Cheng,2014.12.29,用Bioconductor软件包做这类图】

http://pgfe.umassmed.edu/ou/archives/3073

https://www.biostars.org/p/378/

http://genomebiology.com/2012/13/8/R77

http://www.sthda.com/english/wiki/ggbio-visualize-genomic-data

http://www.biomedcentral.com/1471-2105/14/244 (Circos plot in R)



BMC 2013 - Gene expression analysis of induced pluripotent stem cells from aneup.pdf

1.71 MB, 下载次数: 141

Samur 2013 The shaping and functional consequences of the dosage effect landscap.pdf

1.76 MB, 下载次数: 140

回复

使用道具 举报

北京大学生物信息平台论坛

GMT+8, 2017-9-25 23:04 , Processed in 0.089853 second(s), 30 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表