Irys单分子基因组结构成像系统
让我们组织,而不是堆砌数据
在过去的几年里,二代测序的高通量***直主导着基因组研究的发展。
但是二代测序技术可以廉价的获得大量的测序数据,但是受制于较短的读长,这使得科学***们无法简单而直观地看到整个基因组范围的结构变化。现在,针对更长片段的分析方法对于基因组结构研究显得越来越重要。另外,由于基因组的复杂性,诸如重复序列和结构变异,限制了基因组的重构和对功能元件的理解。Irys系统克服了这些困难,利用***种新的方法去获取单分子,尤其是长链DNA分子的图像。
长链DNA分子
Irys系统的核心是已经获得专利的芯片技术。这种芯片可以使盘绕的DNA长链随机解开、拉直,进入纳米***通道。这些纳米通道可以防止半卷曲的DNA分子重新缠绕,并且将大量长链DNA分子拉直,平行排列在***起直接拍照成像(图1)。
IrysPrep 试剂盒可以通过限制性内切酶在特异位点进行剪切,然后连接上带有荧光的碱基使长链DNA分子被标记。软件会将长链上的荧光点翻译成相应的序列信息,以帮助组装基因组图谱。成像后,DNA分子会从纳米通道中排出,新***批的DNA分子会进入。这种动态的,多循环的技术使Irys系统可以实现每小时内完成几个GB的DNA分子的线性化和成像。
图1:长链DNA分子在纳米通道中平等排列,生成高质量的图像
关联的基因组
在单分子水平上对全基因组结构的可视化,不但可以减少了由于DNA扩增和打断等引起的偏差,而且也为***个全基因组的物理图谱提供了骨架,使测序结果更有效,更完整。在图谱中,长序列的基因组结构得以保存,这对发现生物学上特异的结构变异是很有裨益的。Irys所测读的超长片段,对于全基因组图谱的构建,连接功能单元,锚定contigs,确定gap的大小,衡量重复单元的大小,分辨拷贝数变化,插入片段以及异位都是非常必要的。
应用
IrysPrep试剂盒和IrysView软件分析系统支持结构变异检测,组装验证,骨架和NGS数据以及客户自定义的***些长片段单分子数据。
结构变异分析
Irys是***款非常适合做结构变异分析的仪器。NGS的短读长不仅在de novo测序数据的拼装上存在困难,也限制了其在CNVs方面的应用。而其他的方法,比如array-CGH,缺少位置信息而且依赖于探针,因此只能应用在已有参考序列的模式物种上。Irys通过长读长,实现了基因组范围内的结构变异检测。长链基因组的自然状态,染色体平衡异位以及插入(重复)具体位置信息都可以被直接观察到。(图2)另外,利用单分子检测,而不是NGS和CGH数据的叠加,可以让群体中的每个个体都能够被直接检测到。
图2:直观的变异位点分析。通过和果蝇的参考序列(绿色)比对,可以准确的发现拷贝数的多态性(串联重复),该果蝇只有单拷贝(蓝色),并且通过高覆盖度得到了验证。
NGS锚定
Irys在de novo应用中可以拼装出更加完整的数据,和NGS相比,可以在更短时间内提供更完整的基因图谱。任何短读长的测序方法都会造成重复序列很难被正确组装,而Irys特有的超长片段读长,完全可以跨越重复片段和***些包含复杂元件的序列,能够使contig数量和gap数量大大减少(图3)。
其他***些基于限制性内切酶的长片段读取方法会丢失***些小的片段(比如重复序列),但是Irys系统的剪切和加标签的化学方法完全不会破坏DNA长链结构。(图4)
图3:NGS组装。人类MHC区域通过NGS获得5个contigs,通过Irys系统,可以准确地确定它们在基因组中的位置及gaps的大小。(Lam et al, Nature Biotech, 2012).
图4:长链单分子DNA可通读重复片段。酵母的着丝粒区含有很多重复片段,参考序列中并没有完整地呈现它的拷贝数,Irys系统可以通读长链单分子DNA片段,使这***结果清晰呈现。
组装验证
Irys系统得到的基因组图谱可以与NGS数据拼装出的基因组图谱实现非常完美的交叉验证。在IrysView软件中,可以在图表浏览器中看到与已导入的NGS的组装序列的差异,并且以表格的形式列出,这有助于研究人员进行更深层的单分子成像的研究,同时,Irys还可以帮助科研人员快速地设计新的验证及测序实验。
在IrysPrep试剂的支持下,Irys系统可以作为***个开放的平台为研究人员提供多种形式的遗传分析。基于Irys系统的长链单分子荧光标记方法,更多领域的应用都在不断的研发中。