【原创】二代和三代测序PK-谁是业界转录组测序“最强音”

      目前,大部分的转录组测序都是由以Illumina平台为主的二代测序仪完成的,但是二代测序仪无法提供大量的全长转录本并且会丢失可变剪切等重要信息,这使得二代测序获得的转录组数据无法满足某些项目的研究需要。尤其是对于未完成基因组测序的生物,全长转录本测序就更加重要。因为在没有基因组测帮助下,我们可以借助全长转录本数据了解到有关于这个物种的基因功能、基因表达调控和进化关系等多个方面的信息。 


       当然,二代转录组测序在分析差异表达基因方面也具有重要作用,但因为二代测序读长短,难以准确预测全长剪接变异体,最终限制了转录网络的研究。近年来,三代测序技术的出现,为解决这一难题带来了“福音”,也为发表高分文章提供了新的思路。

                                                                                                                                                       

       20166月,两篇采用三代转录本测序的文章相继发表在国际期刊nature communication上,两篇文章一篇是关于玉米的,一篇是有关高粱的。下面我们以高粱为例,介绍一下三代全长转录本测序在应用中的优势。

                                                                                                                                                        

       高粱是重要的生物能源作物,利用三代转录本测序技术获得高粱转录组水平上全面的剪接变异体信息,对于研究植物转录后剪接和多聚腺苷化作用至关重要,也正是这两种机制增加了植物转录本的多样性,或许也是植物之所以能适应恶劣环境的原因所在。

                                                                                                                                                            

       外显子跳跃,内含子保留以及5’3’端的可变剪接形式导致了多种类型的可变剪接事件。以前有报道称在高粱中约1500个基因的前体mRNA经过了可变剪接,另一篇文章用高粱EST数据只分析了2137个可变剪接事件。而研究人员通过三代Iso-Seq测全长转录本共检测出10053个可变剪接事件,比基因注释模型分析的2950多了7000多个(图1a),这可比之前的报道的数量多得多。其中9341个基因(69.9%)只有一种剪接形式,约5200个基因有2个以上的剪接形式(图1b),共获得11300个新的剪接异构体。图1c是三代测序分析得到的一个含有14个剪切异构体的基因与注释得到的该基因的剪接形式的模型举例。

                                                                                                                          

                       1 Iso-Seq得到的可变剪接和剪接异构体分析

                                                                                                                                                

多数mRNA 3’末端的多聚腺苷化对于RNA转运至细胞质,定位,稳定性和翻译是必需的。多聚腺苷化的可变形式产生的转录本异构体在编码区或者3’UTR的不同在动植物的生长发育过程中调控基因的表达。通过二代测序获得的短读长序列对于鉴定多聚腺苷化的可变形式是不可能的。通过三代测序研究人员鉴定出7700多个基因含有2个或以上的多聚腺苷化位点(图2a)。图2b展示的是一个转录本不同poly(A)位点与对应的Iso-Seq的测序深度统计。为验证测序结果的可靠性,随机选取了有poly(A)可变事件的基因,用RACE方法扩增了3’端,结果如图2c。另外研究人员分析发现了2171个新基因,97144.7%)个基因经tblastx注释为蛋白编码基因,28813%)个基因在Swiss-prot数据库中得到注释,其中除了4个基因外都是蛋白编码基因。并鉴定出20个新MiRNAs,其中11个有可变剪接。

                                                                                                                                            

                     可变聚腺苷化分析

                                                                                                                                          

       这表明:三代测序在转录组上的应用具有相当大的优势,可以帮助鉴定全长的剪接异构体及其他形式的转录后调控时间,如选择性多聚腺苷酸化。

                                                                                                                                               

参考文献:

[1] Salah E. Abdel-GhanyMichael HamiltonJennifer L. Jacobi, et al. A survey of the sorghum transcriptome using single-molecule long readsnature communication, 2016.

[2] Bo WangElizabeth TsengMichael Regulski, et al. Unveiling the complexity of the maize transcriptome by single-molecule long-read sequencing. nature communication, 2016.


添加时间:

2016年08月10日

上一个:

千年基因与您相约第七届国际作物科学大会

下一个:

【原创】外显子组测序揭示中国人群中Leber先天黑矇的分子遗传机制
本网站由阿里云提供云计算及安全服务 Powered by CloudDream