首 页 关于冰河 产品中心 AkinaInc-PolySciTech 在线咨询 新闻动态 客户服务 诚聘英才 联系方式
产品货号
产品名称
供应商
 
企业动态
行业新闻
技术理论
科研精粹





信息内容  
新技术:破解RNA测序的方方面面(三)
发布者:admin 发布时间:2010-11-13 19:07:43 阅读:666

转自:生物通

摘要: 随着新一代高通量DNA测序技术的快速发展,RNA测序(RNA-seq)已成为基因表达和转录组分析新的重要手段,并且随着RNA的重要性逐渐被人们所认识,研究人员也开发出多种方法来研究它,各个厂家也相继推出了相关的产品。


生物通报道:随着新一代高通量DNA测序技术的快速发展,RNA测序(RNA-seq)已成为基因表达和转录组分析新的重要手段,并且随着RNA的重要性逐渐被人们所认识,研究人员也开发出多种方法来研究它,各个厂家也相继推出了相关的产品。

目前RNA测序产品技术主要分为两类,一类是将DNA高通量测序技术应用到由mRNA逆转录生成的cDNA上,从而获得来自不同基因的mRNA片段在特定样本中的含量,各种类型的转录本都可以用深度测序技术进行高通量定量检测。另外一类就是最新的直接测序方法:利用单分子测序技术来进行RNA直接测序。

第一类的主要代表是Illumina/Solexa测序技术,具体可见新技术:破解RNA测序的方方面面(二),另外今年Life Technologies公司在这一技术的基础上也开发出了一种单细胞转录组测序技术,可以用于研究细胞从内细胞团发育成胚胎干细胞时的基因表达变化。

这项技术主要是以去年的一篇Nature Methods上的单分子RNA测序方法为技术,在只含有100飞克(1飞克 = 10-15克)mRNA的细胞上验证了这种方法,目前Life Technologies公司正在开发一个试剂盒,用于“低起始量”的转录组测序,但目前还没有上市日期。

利用这种技术,研究人员可以展示当细胞发育时基因表达是如何改变的,他们还鉴别出两类看起来负责调控多能性的microRNA,以及似乎在调控发育中起作用的选择性剪接事件。

而另一种新型单分子测序技术在RNA测序领域当属Helicos BioSciences公司,近期他们也发表了一篇验证文章,证明了利用这汇总单分子测序技术能进行RNA直接测序。

这个过程不同于之前的技术方法主要是在于能跳过将mRNA逆转录成cDNA这一过程,因此不会出现反转录、扩增、连接以及其他cDNA合成步骤的相关困难,而是能利用极少量的总RNA来综合、无偏见地浏览转录组。并且这种方法还能消除转录组分析偏误,目前这种RNA直接测序方法目前的错误率约为4%,大部分是黑暗碱基(dark base)引起的缺失,插入的错误率为1-2%,而替换的概率只有0.1-0.3%。但是这种方法中,由于mRNA比较脆弱,操作上也要多加注意。

这种方法的技术原理是边合成边测序方法,首先研究人员对一段40个碱基的RNA序列进行测序,来检验这种方法。大约一半(48.5%)的读长是20个核苷酸或更长。最长的无误差读数是38个碱基。随后他们将注意力转向酿酒酵母这种模式生物。因为酿酒酵母的大部分RNA本身就存在聚腺苷酸化,所以她们不需要在测序前再加上poly-A尾巴。

研究人员为了让“边合成边测序”的反应适应直接的RNA测序,优化了使用的聚合酶到缓冲液,并利用专利的荧光核苷酸类似物,从而能在poly(dT)包被的表面捕获聚腺苷酸化的RNA,并利用大肠杆菌poly(A)聚合酶I来进行边合成边测序的步骤。目前在Helicos BioSciences公司网站上暂没有看到相关产品的信息,不过相信不久以这种技术为原理的产品将会进入市场。

除了上述的方面,由于RNA测序本质上只是一种高通量的计数技术,它提供了一种方法来决定细胞中的转录有多丰富,因此RNA测序数据的处理和分析看起来就显得额外重要。

将RNA-seq测序文库加入流动槽中的各通道,在桥式PCR扩增后,就可以进行测序了。测序过程中,计算机软件同步地对荧光图像数据进行处理,通过分析荧光信号来确定被测碱基,并给出质量评分。按照图像上的位置坐标,计算机程序将同一位置测得的碱基根据测序顺序连成读段。由于荧光图像文件所占有的磁盘空间很大,通常GA IIx 平台一次实验就能产生上太字节(TB)的图像文件,所以一般情况下不予保留原始的荧光图像数据,而是只保留程序读出的读段数据及对应的质量分值,这就是多数实验室委托测序中心进行RNA-seq测序后得到的最原始的数据。

为方便保存和共享各实验室产生的高通量测序数据,NCBI,EBI,DDBJ等数据中心建立了大容量的数据库 SRA(Sequence Read Archive, http://www.ncbi.nlm.nih.gov/Traces/sra)来存放共享的测序数据。而对于原始数据的加工,首先需要将所有测序读段通过序列映射定位到参考基因组上,这是所有后续处理和分析的基础。

高通量测序的海量数据对计算机算法的运行时间提出了很高的要求。针对诸如llumina/Solexa 等测序平台得到的读段一般较短、且插入删除错误较少等特点,人们开发了一些短序列定位算法。这些算法主要采用空位种子索引法(spaced-seed indexing)或 Burrows-Wheeler 转换(Burrows-Wheeler Transform,BWT)技术来实现。

之后选择性进行基因表达水平估计,选择性剪接事件识别和剪接异构体表达水平,检测新基因,序列注释等,更多相关的内容可以参考相关文章(Progress in Biochemistry and Biophysics 2010, 37(8):834~846)。

近期两个研究小组在软件计算方法方面也获得了新成果:利用一种名为Cufflinks的软件能够随时发现小鼠生肌细胞内新出现的转录子,还能在细胞分化时对转录子表达水平进行监测,从而分析基因表达情况和剪接情况。另外一种名为Scripture的软件可以对源自三个小鼠细胞系的转录组进行再注释,从而对数百个最近新发现的lincRNA(large intergenic noncoding RNA)进行完整的基因模式注释。

过去我们在利用短RNA序列重建转录子时主要采用了两条策略。第一条策略是利用ABySS软件从头构建的方法,这样就可以与全长cDNA序列进行比对,从而解决序列注释的问题。这种办法还可以用于发现参考基因组中未收录或者收录不完全的转录子,还可以用于发现那些缺乏参考基因组RNA序列数据物种的转录子。不过这种利用小片段序列从头组装转录子的方法实施起来非常困难,只有丰度很高的转录子才有可能被成功组装。

另外一种策略就是先将每一个短片段RNA与基因组进行比对,然后再重建转录子。最新的两种方法采用的就是这种策略。这两个小组使用的都是TopHat比对软件,通过该软件与基因组进行比对,获得了大量的剪接体。早期的RNA测序只能得到25~32个碱基长度的序列片段,现在可以得到75个碱基甚至更长的序列片段,这样就更容易进行序列比对,可以将片段末端固定在不同的外显子当中来判断哪种剪接体才是正确的,这样就不需要借助先前的注释信息了。通过上述这两种方法最终都能得到各种转录子图谱,再通过末端配对信息剔除掉不太可能的选择最终就能得到想要的转录子。

随着测序技术的不断进步,我们能够对转录组开展更为深入的测序工作,能够发现更多、更可靠的转录子,目前的大规模并行测序技术已经彻底改变了我们对基因组的研究方法,测序结果的质量也在不断提高,得到的信息量也在爆炸式增长,RNA测序方法目前已经在基因组注释工作以及基因组转录水平,转录后水平调控机制等研究工作上表现出重要的作用,在未来随着各种技术的发展,相信将迸发出更加耀眼的光芒。

延伸阅读:

新技术:破解RNA测序的方方面面()

新技术:破解RNA测序的方方面面()

生物通:万纹)

 
 

打印本页 || 关闭窗口
冰河嘉兴 | 生物秀 | 丁香园 | 生物谷 | 雅虎 | 百度 | 谷歌 |

Copyright © 2007-2015 biohome.com.cn All Rights Reserved. 版权所有 冰河生物
技术支持:亿仁科技