全基因组重测序
对已知基因组序列的物种进行不同个体的基因组测序
全基因组重测序是对已知基因组序列的物种进行不同个体的基因组测序,并在此基础上对个体或群体进行差异性分析。
内容简介
全基因组重测序的个体,通过序列比对,可以找到大量的单核苷酸多态性位点(SNP),插入缺失位点(InDel,Insertion/Deletion)、结构变异位点(SV,Structure Variation)和拷贝数变异位点(CNV,copy number variation)。SBC可以协助客户,通过生物信息手段,分析不同个体基因组间的结构差异, 同时完成注释。
技术路线
提取基因组DNA,利用Covaris进行随机打断,电泳回收所需长度的DNA片段(0.2~5Kb),加上接头, 进行cluster制备 (Solexa)或E-PCR (SOLiD),最后利用Paired-End(Solexa)或者Mate-Pair(SOLiD)的方法对插入片段进行重测序。图1-1,以SOLiD为例,说明整个实验方案。
双末端(Paired-End)测序原理
测序深度(Sequencing Depth):测序得到的碱基总量(bp)与基因组大小(Genome)的比值,它是评价测序量的指标之一。测序深度与基因组覆盖度之间是一个正相关的关系,测序带来的错误率或假阳性结果会随着测序深度的提升而下降。重测序的个体,如果采用的是Paired-End或Mate-Pair方案,当测序深度在10~15X以上时,基因组覆盖度和测序错误率控制均得以保证。
测序深度对基因组覆盖度和测序错误率的影响(HOM:纯合体 HET:杂合体
生物信息分析内容
1.数据量产出
总碱基数量、Totally mapped reads、Uniquely mapped reads统计,测序深度分析。
2.一致性序列组装
与参考基因组序列(Reference genome sequence)的比对分析,利用贝叶斯统计模型检测出每个碱基位点的最大可能性基因型,并组装出该个体基因组一致序列
3.SNP检测及在基因组中的分布
提取全基因组中所有多态性位点,结合质量值、测序深度重复性等因素作进一步的过滤筛选,最终得到可信度高的SNP数据集。并根据参考基因组序列对检测到的变异进行注释。
4.InDel检测及在基因组的分布
在进行mapping的过程中,进行容Gap的比对并检测可信的Short InDel。在检测过程中,Gap的长度为1~5个碱基。
5.Structure Variation检测及在基因组中的分布
目前SBC能够检测到的结构变异类型主要有:插入、缺失、复制、倒位、易位等。根据测序个体序列与参考基因组序列比对分析结果,检测全基因组水平的结构变异并对检测到的变异进进行注释。
全基因组重测序生物信息学分析流程
参考资料
最新修订时间:2023-12-24 18:58
目录
概述
内容简介
技术路线
参考资料