Q1:什么是Read、Contig、Scaffold?
A1:Read:测序读到的碱基序列片段。Contig:由reads通过对overlap区域拼接组装成的没有gap的序列段。Scaffold:通过pair ends 信息确定出的contig 排列,中间有gap。
Q2:什么是Contig N50和Scaffold N50?
A2:把组装出的contigs或scaffolds从大到小排列,当其累计长度刚刚超过全部组装序列总长度50%时,最后一个contig或scaffold的大小即为N50的大小,N50 对评价组装序列的连续性、完整性有重要意义。
Q3:对于基因组项目还能按照之前的单一的Hiseq 平台策略来进行?
A3:可以,对于普通基因组或者对于组装指标没有特别高的要求的项目可以采用原来的仅针对Hiseq平台的测序策略。需要注意的是如果完全按照原来的策略来进行,500bp和800bp文库不能用Hiseq4000平台,只能用Hiseq2500平台进行测序。
Q4:怎样评估研究物种的基因组大小?
A4:查询植物基因组大小的网站:http://data.kew.org/cvalues。
查询动物基因组大小的网站:http://www.genomesize.com。