北京大学生物信息平台论坛

 找回密码
 立即注册
搜索
热搜: 通知 活动

RNA-seq初学者的感悟

[复制链接]
chenxia 发表于 2016-4-21 16:12:42 | 显示全部楼层 |阅读模式
作为初学两周生物信息学的小菜鸟一枚(不懂编程,只会基础的linux指令),在此分享一些学习RNA-seq资源和一些拙见,也希望可以和大家共同探讨学习中遇到的问题,以期共同进步。

RNA-seq背景学习
首先,对于学习流程,个人偏向先看懂背景,再进行数据分析,所以在此推荐一篇最新的关于RNA-seq的review,在这里你可以了解到关于RNA-seq的全面的应用的知识,以及在RNA-seq的分析过程中会遇到的一些分析策略选择的建议。链接:http://www.ncbi.nlm.nih.gov/pubmed/26813401(此篇因为讲得范围广,涉及的点多,初学者就会有很多疑惑)

RNA-seq分析练习
在上述提到的综述中,会看到关于Cufflinks和Tophat两个软件在RNA-seq分析中的应用。并且有篇关于使用它们进行RNA-seq的数据分析的指导性文献(链接:http://www.ncbi.nlm.nih.gov/pubmed/22383036接下来,可以利用这篇文献进行实战。

这时需要有基本的linux的操作知识,在此分享从生物秀上下载的生物信息学的教程http://wenku.baidu.com/view/266f8ee658fb770bf78a55e6,教程很长先看懂指令可以满足初期的软件的使用,后续的可以慢慢看,了解生物信息学的一些软件及资源。

实战过程中:一定要先理清分析的目的,这样使用软件会不易出错,并且多看这个软件的manuals:http://cole-trapnell-lab.github.io/cufflinks/manual/
对于该文献中涉及的数据可以在GEO网站上下载。

软件处理完原始数据,对于软件生成的数据,我用了一个笨办法就是在R中直接打开看数据的内部到底是什么。虽然比较费时,但是理解软件的生成数据和进行下一步数据可视化是很有效的。若有更好的办法,也希望大家共享。

R语言学习
在实战中,涉及R环境的package的使用,我们一般直接在RStudio中操作,  https://www.rstudio.com/products/rstudio/download/ (下载,安装),对于没有R语言基础的同学,这又是一个难点,因为需要掌握R语言的基本参数的使用。这里有一套《R语言入门 PPT。

在此,说说个人的做法以作参考,尽多地看相关的教程和经验(知乎,微信)来理解R语言的实质,(有中文的实用教程还是比较快)获取相关的实现作图的packages(ggplot)的用法,相关推荐的教程和网址如下:

当然,对于一些实际的package的使用,还是需要练的,因为里面的参数的设置,在图像的反馈中理解会比较直观。

分析做图
在此就小小先展示一下自己画得比较基本的图吧。
barsRplot.png Rplot  vocano.png Rplot_duochongzhifangtu.png Rplotdensity.png
看到图时,就能真切体会数据分析中,数据可视化的意义啦。

个人感受
生物信息学中的分析须基于对原理的深刻认识和数据本身的意义,否则分许出来的数据自己都没办法解释。因此,理解实验思路,或者带着问题来使用和学习分析软件应该是不错的。

目前,对于RNA-seq的疑惑还是有很多,甚至说连入门都没到,比如对于reads的处理,查找文献也只是看到字面的,要想深入还是得靠练习,所以接下来还是继续重复文献的分析,据有经验的人士介绍,引用率较高的文献是不错的选择。后续,我会把自己的重复文献分析中遇到的问题与大家探讨。
回复

使用道具 举报

北京大学生物信息平台论坛

GMT+8, 2017-9-27 05:53 , Processed in 0.093890 second(s), 26 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表