简介
转录组研究是理解生物机体功能的一个重要途径。传统二代转录组测序无法直接获得单个RNA分子由5ˊ到3ˊ的全部序列。基于PacBio三代测序平台的转录组研究,无需打断,直接读取反转录的全长cDNA,能够有效的获取高质量的单个RNA分子的全部序列,准确辨别二代测序无法识别的同源异构体(isoform)、同源基因、超家族基因或等位基因表达的转录本。
对于人类以及动植物样本,转录本长度分布会存在一定差异,一般情况下建议构建四个不同长度的文库:1.0-2.0Kb;2.0-3.0Kb;3.0-6.0Kb;>6.0Kb,然后针对每个文库,建议至少测序2个SMRT Cell的数据量;如需获得较为全面的isoform信息,则建议至少测序8个SMRT Cell的数据量进行分析。
技术优势
1. 直接测序即可获得全长转录组序列信息,one read=one full lengh transcript;
2. 转录本序列无需拼接;
3. 获得全面的可变剪切、融合基因以及Isoform信息。
结果展示
1、可变剪接
全长转录组的分析结果明确地体现了可变剪接的各种形式,比二代转录组预测的结果要更加精确和丰富。
2、融合基因
全长转录组的融合基因分析结果(图中的蓝色部分),相比于基于基因组注释的预测结果(绿色部分),全长转录组准确地定位了融合基因的存在。
3、精确定量异构体(Isoform)的表达量
全长转录组可精确分析同一基因的若干异构体的表达量,由多个红点表示;二代转绿组由于不能很好地分辨异构体,只能笼统地基于异构体预测结果进行定量,仅由1-2个绿点表示。
案例分析
目前已经采用PacBio RS II平台开展Iso-Seq项目的物种有:人类基因组全长转录本研究(Nature Biotechnology, 2013),人类胚胎肝细胞全长转录本项目研究(PNAS, 2013),淋巴细胞全长转录本研究(PNAS, 2014),小面筋蛋白基因isoform测序分析(Gene, 2014),全长转录本测序鉴定鸡的新的Isoform信息(PLOS ONE, 2014),小嘴狐猴全长转录本研究(BMC Genomics, 2014),欧洲乌贼全场转录本研究(PAGXIII, 2015),牛NK-Lysin基因家族Iso-Seq测序分析(PAGXIII, 2015),挪威云杉全长转录本测序完善基因组注释信息(conference PPT, 2014)。
样品要求
1. 总RNA:浓度≥200 ng/μl,总量≥10 μg;OD260/280介于1.8-2.2之间,OD260/230值应≥2.0。电泳检测28S:18S至少大于1.5;并确保RNA无降解,无污染。
2. 组织样品:动物、植物、微生物总量大于500 mg的新鲜样品(植物材料应尽量选取幼嫩部位)。采样后将样品立即用RNAlater和液氮速冻,保存于-80℃(保存期不超过一个月),送样时使用干冰运输(不超过72 h);提取RNA后经变性电泳,保证各RNA条带清晰、比例适中、完整性好、无降解。特别要求样品分成3份,方便后续提取,避免同一份样品反复冻融造成样品降解。
3. 细胞样品:先使用TRIzol试剂进行处理,每0.25 mL样品(5-10×106个细胞)加入0.75 mL TRIzol试剂(可参考TRIzol试剂说明书),于-80℃保存,并提供2-3份该样品。原则上不接收未经TRIzol处理的细胞样品。
4. 样品保存期间切忌反复冻融。5. 送样管务必标清样品编号,管口使用Parafilm膜密封。
参考文献
1、Kim C. Worley et al. (2015) European Cuttlefish Whole Transcriptome Sequencing: A Single-Molecule Full Length Transcript Survey with Iso-Seq Method (2015, PAGXIII, San Diego, CA).
2、Iain C Macaulay et al. (2015) G&t-seq: parallel sequencing of single-cell genomes and transcriptomes. Nature Methods.
3、Michiel van Eijk (2015) Genome assembly and Iso-Seq transcriptome sequencing of tetraploid cotton(2015. PAGXIII, San Diego, CA).
4、Jianhai Xiang et al. (2015) A Survey of Potential Antiviral Targets for the Pacific Whiteleg Shrimp Litopenaeus vannamei from RNAseq Transcriptome.( PAG Aisa Singapore).
5、Junfeng Chen et al. (2015) Genomic Organization and Expression of the Bovine NK-Lysin Gene Family. (2015, PAGXIII, San Diego, CA).
6、Wei Zhang et al. (2014) PacBio sequencing of gene families — A case study with wheat gluten genes. Gene.
7、Elizabeth Tseng et al. (2014) Isoform Sequencing: Unveiling the Complex Landscape of the Eukaryotic Transcriptome on the PacBio® RS II.Pacific Bioscience.
8、Sean Thomas et al. (2014) Long-Read Sequencing of Chicken Transcripts and Identification of New Transcript Isoforms. PLOS One.
9、Yao-Cheng Lin et al. (2014) PacBio Single Molecule Sequencing to Improve the Norway Spruce Genome Annotation.
10、Hagen Tilgner et al. (2014) Defining a personal, allele-specific, and single-molecule long-read transcriptome. PNAS.
11、Peter A Larsen et al. (2014) The utility of PacBio circular consensus sequencing for characterizing complex gene families in non-model organisms. BMC Genomics.