北京大学生物信息平台论坛

 找回密码
 立即注册
搜索
热搜: 通知 活动

Small RNA reads中的N如何处理?

[复制链接]
wuhh 发表于 2016-1-20 22:49:00 | 显示全部楼层 |阅读模式
各位,请教一个小RNA分析中的问题:
Raw read在cutadaptor时,对于reads中N通常需要怎么处理?我的reads中有挺多第一个碱基都是N,如果去掉的话,对于之后挑选21-22nt 的小RNA是否会有影响?
望指教~~~多谢!
回复

使用道具 举报

 楼主| wuhh 发表于 2016-1-21 15:57:38 | 显示全部楼层
怎么都没人回复勒?自己顶一个
回复 支持 反对

使用道具 举报

perry博士 发表于 2016-1-21 20:15:21 | 显示全部楼层
small RNA的长度估计就在21~23nt左右。目前测序仪拿到的测序reads长度比small RNA长度要长,所以需要在后续分析之前将potential target segment提取出来。一般情况下,提取的方法是根据你建库方法来DIY的。比如small RNA在total RNA含量较少,不需要大量测序就能有很好的覆盖,所以我们一般会选择混合样品建库(用不同的barcode),这时候测序仪读出来的reads可能包含adptor、barcode、target segment等序列。只要你知道adptor序列构成,barcode长度,一般就能准确提取出small RNA的序列!至于N,如果包含在small RNA序列中间,则需要保留,如果出现在序列最前或末尾,去掉就行。当然,如果测出的small RNA中包含太多N,那么信息量就不大了,建议过滤掉相应的reads。
Hope it helps!
回复 支持 反对

使用道具 举报

Czh3 发表于 2016-1-21 23:35:00 | 显示全部楼层
测序第一个碱基是N的我觉得要算到reads长度上去,N是代表不能确定碱基型(比如测序质量非常非常低,不能确定碱基),但是这里确实有个碱基。测序仪不稳定是经常reads前面出现N的情况(X-TEN刚出来是我们就遇到过这种情况,后续软件和试剂升级这种现象少了很多)。
illumina测序只会有3‘端adapter,5’端是结合sequence primer的,所以5‘(即reads开头)一般不会有adapter的,即第一位是sample打断后fragment上的测序碱基(如果是small RNA不需要打断,就是反转后的cDNA),而不是adapter,在选特定长度reads时,即使是N也应该算是一位不明确的碱基。
回复 支持 反对

使用道具 举报

 楼主| wuhh 发表于 2016-1-22 10:37:41 | 显示全部楼层
Czh3 发表于 2016-1-21 23:35
测序第一个碱基是N的我觉得要算到reads长度上去,N是代表不能确定碱基型(比如测序质量非常非常低,不能确 ...

恩,那这样的话,5‘的N肯定是会造成错配,所以Mapping时候就容许错配,这些read才能map上,不允许错配的话,就map不上,也不需要在cutadaptor的时候选择去除这些含有N的reads了吧。
回复 支持 反对

使用道具 举报

 楼主| wuhh 发表于 2016-1-22 10:40:44 | 显示全部楼层
perry博士 发表于 2016-1-21 20:15
small RNA的长度估计就在21~23nt左右。目前测序仪拿到的测序reads长度比small RNA长度要长,所以需要在后续 ...

多谢朱师兄的经验分享,It helps a lot!
回复 支持 反对

使用道具 举报

北京大学生物信息平台论坛

GMT+8, 2017-11-24 15:19 , Processed in 0.086422 second(s), 22 queries .

Powered by Discuz! X3

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表