联系我们
当前位置:
三代WGS全基因组SV检测

三代WGS全基因组SV检测

三代WGS全基因组SV检测

1. 背景介绍

基因编辑技术的快速发展,特别是以CRISPR/Cas9为代表的DSB(双链断裂)型基因编辑工具,为基因治疗和细胞治疗带来了革命性的突破。然而,DSB在诱导靶向编辑的同时,也可能在非预期位点(脱靶)或靶点附近引发大规模的基因组结构变异(Structural Variation, SV),如大片段的缺失、插入、重复、倒位和易位等。这些复杂的基因组重排事件可能导致内源基因的功能失活、致癌基因的激活或染色体不稳定性,对基因编辑产品的安全性和有效性构成严重威胁 [1]。

传统的二代测序(Next-Generation Sequencing, NGS)技术,由于其读长较短(通常为150-300 bp),在检测复杂SV方面存在固有局限性。短读长难以跨越大型或位于高重复区域的SV断点,导致对易位(Translocation, BND)和复杂重排等事件的识别能力不足 [2]。因此,开发一种能够准确、全面评估基因编辑诱导的SV的检测方法至关重要。

三代测序(Third-Generation Sequencing, TGS)技术,特别是牛津纳米孔技术(Oxford Nanopore Technologies, ONT),以其超长读长(平均16-20 kb)和单分子测序的独特优势,为解决这一难题提供了理想的解决方案。超长读长能够轻松跨越复杂的SV断点,准确识别各种类型的结构变异,尤其是在二代测序难以覆盖的高重复区域(如HLA区域)和GC含量高的区域。本方案基于三代Nanopore测序技术,旨在为基因编辑产品提供一个科学、严谨、全面的SV检测和安全性评估体系。

2. 技术原理与检测流程

2.1 Nanopore测序原理

Nanopore测序是一种基于电信号的单分子实时测序技术。其核心是一个由特殊蛋白质构成的纳米级小孔(Nanopore),嵌入到绝缘膜中。在电场驱动下,单链DNA分子在马达蛋白的牵引下以特定速率通过纳米孔。当不同碱基(A, T, C, G)通过纳米孔时,会产生特征性的离子电流变化信号。通过实时捕捉和解析这些电流信号,即可直接读出DNA分子的碱基序列 [3]。

图1:Nanopore测序原理示意图

DNA分子在马达蛋白的引导下解旋并通过纳米孔,不同碱基通过时产生独特的电流信号,从而实现序列的实时读取。

2.2 三代Nanopore SV检测流程

本方案的检测流程分为四个主要阶段:实验室阶段、数据处理阶段、SV检测与鉴定阶段、注释与评估阶段。

(1)实验室阶段:从实验组和对照组样本中提取高质量的基因组DNA,进行质检后构建Nanopore测序文库,然后进行三代测序(测序深度≥30×)。

(2)数据处理阶段:使用Filtlong对原始测序数据进行质控,然后使用minimap2将高质量的长读长序列比对到参考基因组上 [4]。

(3)SV检测与鉴定阶段:使用Severus等专业工具,在Case-Control模式下检测实验组特有的体细胞SV(somatic SV)。同时,使用CRISPRme等工具预测sgRNA的潜在脱靶位点。通过比较SV坐标与预测位点的距离(< 50 bp),鉴定sgRNA依赖型SV。

(4)注释与评估阶段:使用AnnotSV等工具对鉴定出的SV进行功能注释,评估其对基因功能的影响和潜在的临床风险。如有GUIDE-seq等其他实验数据,可进行交叉验证,提高结果的可靠性。

图2:三代Nanopore SV检测流程图

2.3 核心分析逻辑

2.3.1 结构变异检测(Severus)

Severus是一款专为长读长测序数据设计的SV检测工具,能够准确识别体细胞SV和复杂的基因组重排 [5]。本方案采用Case-Control模式,通过比较实验组和对照组的基因组,精确识别由基因编辑引入的somatic SV。

2.3.2 sgRNA依赖性鉴定

为了区分基因编辑直接导致的SV和随机发生的背景变异,我们进行sgRNA依赖性鉴定。首先,使用CRISPRme等工具,基于sgRNA序列和PAM序列,预测全基因组范围内的潜在在靶和脱靶位点。然后,将Severus检测到的somatic SV的基因组坐标与预测位点进行比较。

2.3.3 SV注释与风险评估

对鉴定出的sgRNA依赖型SV进行全面的功能注释和风险评估是评估基因编辑安全性的关键环节。我们使用AnnotSV等专业工具,整合多个权威数据库进行注释:

(1)基因功能注释: 确定SV是否影响基因区域(外显子、内含子等),是否导致移码突变或基因融合。

(2)癌症相关性评估: 将受影响的基因与ONCOGENE(致癌基因)和TSG(肿瘤抑制基因)数据库进行比对,评估潜在的致瘤性风险。

(3)临床表型关联: 结合ACMG指南和ClinVar等数据库,评估SV的潜在致病性。

3. 技术优势

本方案结合了三代测序的技术优势和专业的生信分析流程,具有以下核心优势:

优势维度

具体描述

超长读长

平均读长16-20kb,N50可达20-27kb,能够跨越复杂结构变异,准确识别易位、倒位等事件。

无PCR偏倚

单分子测序,省略PCR扩增步骤,避免扩增偏倚,保留原始序列信息,确保SV检测的准确性。

复杂变异检测

专为长读长设计,能够准确识别易位(BND)、复杂重排等二代测序难以检测的结构变异类型。

高重复区域覆盖

能够覆盖HLA等高重复区域和GC含量高的区域,检测二代测序的盲区,提供更全面的基因组视图。

专业的SV检测工具

使用Severus等最前沿的SV检测工具,在Case-Control模式下准确识别somatic SV,有效区分编辑相关和背景变异。

全面的功能注释

使用AnnotSV等专业工具,整合ONCOGENE、TSG等权威数据库,全面评估SV的功能影响和临床风险。

4. 三代测序与二代测序对比

图3:三代测序 vs 二代测序对比示意图

图3直观地展示了三代测序(TGS)和二代测序(NGS)在SV检测方面的核心差异。三代测序凭借其超长读长和无PCR偏倚的优势,在复杂SV检测方面远优于二代测序。

5.应用场景

(1)基因编辑脱靶效应评估: 全面、准确地检测由CRISPR/Cas9等工具引入的各类结构变异,特别是易位和复杂重排。

(2)HLA区域编辑安全性评估: HLA区域是典型的高重复、高多态性区域,三代测序能够准确评估该区域的编辑效果和安全性。

(3)CAR-T等细胞治疗产品开发与质控: 在产品开发和生产过程中,对基因编辑细胞进行全面的SV检测,确保产品的安全性。

(4)复杂基因组区域变异研究: 研究高重复区域、着丝粒、端粒等二代测序难以覆盖区域的结构变异。

(5)与二代测序互补: 结合二代测序的SNV/InDel检测优势和三代测序的SV检测优势,实现对基因组变异的全面覆盖。

6.示例报告

6.1 数据质控与比对

为直观呈现数据整体质量,本报告分别展示了每个样本的测序读长(上图)和碱基质量(下图)的频率分布图。

图4:reads长度以及碱基质量分布图

将三代原始下机质控后的数据经过minimap比对到替换后的参考基因组的结果统计如下表所示:

Samples

Total reads

Mapped reads

Mapping efficient(%)

Sample

5644815

5644592

100

Control

4782121

4781257

99.98

6.2 主要结果展示

图5:依赖型SV基因组分布circos图

图6:依赖型SV注释示例

7.服务内容与样本要求

7.1 服务内容

服务环节

服务内容

项目咨询

·资深技术专家协助您设计严谨的实验方案,明确样本和信息要求

样本检测

·标准化的样本质检、文库构建和高深度三代测序(测序深度≥30×)

数据分析

·执行完整的数据质控、序列比对、SV检测、sgRNA依赖性鉴定和功能注释等高级生物信息学分析流程

报告交付

·在承诺周期内(35-40个工作日)交付详尽的PDF报告和完整的分析结果文件:完整的检测分析报告

·原始测序数据

·SV检测结果

·sgRNA依赖型SV列表

·SV注释结果

·Circos可视化图

售后支持

·提供专业的报告解读和后续技术咨询

7.2 样本与要求

要求类别

项目

具体要求

样本送样要求

基因组 DNA (gDNA)

·总量:≥ 2 µg (Qubit定量)
·浓度: ≥ 50 ng/µL
·纯度: OD260/280 = 1.8-2.0

细胞样本

·细胞量: ≥ 5 × 10⁶ 个细胞
·制成细胞沉淀
·保存条件: -80°C 或液氮保存

组织样本

·重量: ≥ 100 mg
·处理方式:液氮速冻
·保存条件:-80°C 或液氮保存

必需信息

sgRNA 信息

·完整的 20 nt sgRNA 序列
·PAM 序列

Cas 系统信息

·明确指出所使用的Cas蛋白类型(如SpCas9, SaCas9等)

样本信息

·清晰的样本编号
·编辑组与对照组的配对关系说明

交付周期

交付周期

·35-40个工作日

8.参考文献

[1] Cosenza, M. R., et al.(2022). Structural Variation in Cancer: Role, Prevalence, and Mechanisms. Annu Rev Genomics Hum Genet.

[2] Ho, S. S., et al.(2020). The current landscape of structural variation detection tools. Briefings in Bioinformatics.

[3] Deamer, D., et al.(2016). Nanopores: a new tool for single-molecule analysis. Chemical Society Reviews.

[4] Li, H. (2018). Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics.

[5] Keskus, A. G., et al.(2025). Severus detects somatic structural variation and complex rearrangements in cancer genomes using long-read sequencing. Nat Biotechnol.

[6] Cancellieri, S., et al.(2023). Human genetic diversity alters off-target outcomes of therapeutic gene editing. Nat Genet.

[7] McLaren, W., et al.(2016). The Ensembl Variant Effect Predictor. Genome Biol.