近年来,随着NGS测序技术的发展,转录组测序已经成为研究基因表达调控的主要手段。通过转录组测序可挖掘基因功能、基因表达及调控模式,揭示表型背后的分子生物学机制,已经广泛应用于与基础研究、临床诊断及药物研发等领域。但由于NGS测序平台受到读长的限制(PE150),在转录本组装的过程中存在较多的嵌合体,无法得到完整的转录本信息,进而影响基因融合、表达差异、可变剪接等分析结果的准确性。PacBio测序平台基于第三代单分子实时测序的技术原理,最大优势之一即读长较长,可达到 10-40Kb,该长度已超过一般转录组中典型的基因长度,所以利用第三代 PacBio测序平台进行转录组的研究,可以得到全长转录本信息,无需组装,保证了转录组测序结果的准确性。

图1 PacBio全长转录组分析流程

图1 序列长度分布图(构建的是1K-2K,2K-3K文库)

图2 基因功能注释图
经典案例
第三代单分子测序揭示玉米转录组的复杂性 Nature Communication.2016.
Unveiling the complexity of the maize transcriptome by single-molecule long-read sequencing. Nature Communication.2016, DOI: 10.1038/ncomms11708 ./span>
本文用三代单分子测序平台对玉米的转录组进行了详尽的分析,样品为B73株系的根、v8时期穗、v7时期穗、花粉、胚芽、胚乳,分析得到111,151条转录本,其中约70%的基因在玉米RefGen_v3参考基因中得到注释,57%的转录本为已知基因的新转录本。同时,作者用二代测序技术对三代分析结果进行验证,90%的可变剪接得到二代数据支持。另外,作者发现了大量的lncRNA,本文最终揭示了玉米转录组的复杂性,并且其基因表达模式较之前威九国际的理解更为复杂。

图1 PacBio结果与已知基因组结果比较

图2 转录本在染色体上的密度分布CIRCOS图

图3 PacBio鉴定得到的lncRNA

图4 PacBio对已知基因模型的修正
推荐文献
[1] A survey of the sorghum transcriptome using single-molecule long reads. Nature Communication.2016, doi: 10.1038/ncomms11706.
[2] Full-length transcriptome sequences and splice variants obtained by a combination of sequencing platforms applied to different root tissues of Salvia miltiorrhiza and tanshinone biosynthesis. The Plant Journal. 2015, doi: 10.1111/tpj.12865.
[3] Single-molecule real-time transcript sequencing facilitates commom wheat genome annotation and grain transcriptome research. BMC Genomics.2015, doi: 10.1186/s12864-015-2257-y.
测序策略
产品类型 | 建库类型 | 测序策略 | 周期 |
PacBio全长转录组 | PacBio文库 | 建3个文库(1-2k,2-3k,3-6k),测8个cell
建4个文库(1-2k,2-3k,3-6k,5-10k),测10个cell | 60工作日 |
送样建议
样品类型 | 总量 | 浓度 | 其他要求 |
动植物、昆虫、真菌Total RNA | 200ng | 15ng/μL≤c≤500ng/μL | RIN>8.0,28S/18S≥1.5(昆虫无RIN和28S/18S的要求)
图谱基线无上抬,5S 峰正常。 |
血清血浆 | 20ng | 2ng/μL | / |
Small RNA(<200nt) | 100ng | 20ng/μL | / |
新鲜动物组织干重 | 30mg | / | / |
新鲜植物组织干重 | 50mg | / | / |
新鲜培养细胞数/菌体 | 2×105个 | / | / |
全血 | 0.2mL | / | / |
FFPE样本 | 100mm2,10μm厚的切片2片以上 | / | / |
FAQ
PacBio全长转录组测序常见问题