全基因组重测序是对已知基因组序列的物种进行不同个体的
基因组测序,并在此基础上对个体或群体进行差异性分析。
全基因组重测序的个体,通过序列比对,可以找到大量的
单核苷酸多态性位点(SNP),插入缺失位点(InDel,Insertion/Deletion)、结构变异位点(SV,Structure Variation)和
拷贝数变异位点(CNV,copy number variation)。SBC可以协助客户,通过
生物信息手段,分析不同
个体基因组间的
结构差异, 同时完成注释。
提取基因组
DNA,利用Covaris进行随机打断,电泳回收所需长度的DNA片段(0.2~5Kb),加上接头, 进行cluster制备 (Solexa)或E-
PCR (SOLiD),最后利用Paired-End(Solexa)或者Mate-Pair(SOLiD)的方法对
插入片段进行重测序。图1-1,以SOLiD为例,说明整个实验方案。
测序深度(Sequencing Depth):测序得到的
碱基总量(
bp)与
基因组大小(Genome)的比值,它是评价测序量的指标之一。测序深度与基因组
覆盖度之间是一个
正相关的关系,测序带来的错误率或
假阳性结果会随着测序深度的提升而下降。重测序的个体,如果采用的是Paired-End或Mate-Pair方案,当测序深度在10~15X以上时,基因组覆盖度和测序错误率控制均得以保证。
测序深度对基因组覆盖度和测序错误率的影响(HOM:
纯合体 HET:
杂合体)
与参考基因组序列(Reference genome sequence)的比对分析,利用
贝叶斯统计模型检测出每个碱基位点的最大可能性
基因型,并组装出该
个体基因组的
一致序列。
目前SBC能够检测到的结构变异类型主要有:插入、缺失、复制、
倒位、易位等。根据测序个体序列与参考基因组
序列比对分析结果,检测全基因组水平的结构变异并对检测到的变异进进行注释。