1. 背景介绍
基因编辑技术的快速发展,特别是以CRISPR/Cas9为代表的DSB(双链断裂)型基因编辑工具,为基因治疗和细胞治疗带来了革命性的突破。然而,DSB在诱导靶向编辑的同时,也可能在非预期位点(脱靶)或靶点附近引发大规模的基因组结构变异(Structural Variation, SV),如大片段的缺失、插入、重复、倒位和易位等。这些复杂的基因组重排事件可能导致内源基因的功能失活、致癌基因的激活或染色体不稳定性,对基因编辑产品的安全性和有效性构成严重威胁 [1]。
传统的二代测序(Next-Generation Sequencing, NGS)技术,由于其读长较短(通常为150-300 bp),在检测复杂SV方面存在固有局限性。短读长难以跨越大型或位于高重复区域的SV断点,导致对易位(Translocation, BND)和复杂重排等事件的识别能力不足 [2]。因此,开发一种能够准确、全面评估基因编辑诱导的SV的检测方法至关重要。
三代测序(Third-Generation Sequencing, TGS)技术,特别是牛津纳米孔技术(Oxford Nanopore Technologies, ONT),以其超长读长(平均16-20 kb)和单分子测序的独特优势,为解决这一难题提供了理想的解决方案。超长读长能够轻松跨越复杂的SV断点,准确识别各种类型的结构变异,尤其是在二代测序难以覆盖的高重复区域(如HLA区域)和GC含量高的区域。本方案基于三代Nanopore测序技术,旨在为基因编辑产品提供一个科学、严谨、全面的SV检测和安全性评估体系。
Nanopore测序是一种基于电信号的单分子实时测序技术。其核心是一个由特殊蛋白质构成的纳米级小孔(Nanopore),嵌入到绝缘膜中。在电场驱动下,单链DNA分子在马达蛋白的牵引下以特定速率通过纳米孔。当不同碱基(A, T, C, G)通过纳米孔时,会产生特征性的离子电流变化信号。通过实时捕捉和解析这些电流信号,即可直接读出DNA分子的碱基序列 [3]。

图1:Nanopore测序原理示意图
DNA分子在马达蛋白的引导下解旋并通过纳米孔,不同碱基通过时产生独特的电流信号,从而实现序列的实时读取。
本方案的检测流程分为四个主要阶段:实验室阶段、数据处理阶段、SV检测与鉴定阶段、注释与评估阶段。
(1)实验室阶段:从实验组和对照组样本中提取高质量的基因组DNA,进行质检后构建Nanopore测序文库,然后进行三代测序(测序深度≥30×)。
(2)数据处理阶段:使用Filtlong对原始测序数据进行质控,然后使用minimap2将高质量的长读长序列比对到参考基因组上 [4]。
(3)SV检测与鉴定阶段:使用Severus等专业工具,在Case-Control模式下检测实验组特有的体细胞SV(somatic SV)。同时,使用CRISPRme等工具预测sgRNA的潜在脱靶位点。通过比较SV坐标与预测位点的距离(< 50 bp),鉴定sgRNA依赖型SV。
(4)注释与评估阶段:使用AnnotSV等工具对鉴定出的SV进行功能注释,评估其对基因功能的影响和潜在的临床风险。如有GUIDE-seq等其他实验数据,可进行交叉验证,提高结果的可靠性。

图2:三代Nanopore SV检测流程图
Severus是一款专为长读长测序数据设计的SV检测工具,能够准确识别体细胞SV和复杂的基因组重排 [5]。本方案采用Case-Control模式,通过比较实验组和对照组的基因组,精确识别由基因编辑引入的somatic SV。
为了区分基因编辑直接导致的SV和随机发生的背景变异,我们进行sgRNA依赖性鉴定。首先,使用CRISPRme等工具,基于sgRNA序列和PAM序列,预测全基因组范围内的潜在在靶和脱靶位点。然后,将Severus检测到的somatic SV的基因组坐标与预测位点进行比较。
对鉴定出的sgRNA依赖型SV进行全面的功能注释和风险评估是评估基因编辑安全性的关键环节。我们使用AnnotSV等专业工具,整合多个权威数据库进行注释:
(1)基因功能注释: 确定SV是否影响基因区域(外显子、内含子等),是否导致移码突变或基因融合。
(2)癌症相关性评估: 将受影响的基因与ONCOGENE(致癌基因)和TSG(肿瘤抑制基因)数据库进行比对,评估潜在的致瘤性风险。
(3)临床表型关联: 结合ACMG指南和ClinVar等数据库,评估SV的潜在致病性。
本方案结合了三代测序的技术优势和专业的生信分析流程,具有以下核心优势:
优势维度 | 具体描述 |
超长读长 | 平均读长16-20kb,N50可达20-27kb,能够跨越复杂结构变异,准确识别易位、倒位等事件。 |
无PCR偏倚 | 单分子测序,省略PCR扩增步骤,避免扩增偏倚,保留原始序列信息,确保SV检测的准确性。 |
复杂变异检测 | 专为长读长设计,能够准确识别易位(BND)、复杂重排等二代测序难以检测的结构变异类型。 |
高重复区域覆盖 | 能够覆盖HLA等高重复区域和GC含量高的区域,检测二代测序的盲区,提供更全面的基因组视图。 |
专业的SV检测工具 | 使用Severus等最前沿的SV检测工具,在Case-Control模式下准确识别somatic SV,有效区分编辑相关和背景变异。 |
全面的功能注释 | 使用AnnotSV等专业工具,整合ONCOGENE、TSG等权威数据库,全面评估SV的功能影响和临床风险。 |

图3:三代测序 vs 二代测序对比示意图
图3直观地展示了三代测序(TGS)和二代测序(NGS)在SV检测方面的核心差异。三代测序凭借其超长读长和无PCR偏倚的优势,在复杂SV检测方面远优于二代测序。
(1)基因编辑脱靶效应评估: 全面、准确地检测由CRISPR/Cas9等工具引入的各类结构变异,特别是易位和复杂重排。
(2)HLA区域编辑安全性评估: HLA区域是典型的高重复、高多态性区域,三代测序能够准确评估该区域的编辑效果和安全性。
(3)CAR-T等细胞治疗产品开发与质控: 在产品开发和生产过程中,对基因编辑细胞进行全面的SV检测,确保产品的安全性。
(4)复杂基因组区域变异研究: 研究高重复区域、着丝粒、端粒等二代测序难以覆盖区域的结构变异。
(5)与二代测序互补: 结合二代测序的SNV/InDel检测优势和三代测序的SV检测优势,实现对基因组变异的全面覆盖。
6.示例报告
6.1 数据质控与比对
为直观呈现数据整体质量,本报告分别展示了每个样本的测序读长(上图)和碱基质量(下图)的频率分布图。


图4:reads长度以及碱基质量分布图
将三代原始下机质控后的数据经过minimap比对到替换后的参考基因组的结果统计如下表所示:
Samples | Total reads | Mapped reads | Mapping efficient(%) |
Sample | 5644815 | 5644592 | 100 |
Control | 4782121 | 4781257 | 99.98 |
6.2 主要结果展示

图5:依赖型SV基因组分布circos图

图6:依赖型SV注释示例
7.服务内容与样本要求
7.1 服务内容
服务环节 | 服务内容 |
|---|---|
项目咨询 | ·资深技术专家协助您设计严谨的实验方案,明确样本和信息要求 |
样本检测 | ·标准化的样本质检、文库构建和高深度三代测序(测序深度≥30×) |
数据分析 | ·执行完整的数据质控、序列比对、SV检测、sgRNA依赖性鉴定和功能注释等高级生物信息学分析流程 |
报告交付 | ·在承诺周期内(35-40个工作日)交付详尽的PDF报告和完整的分析结果文件:完整的检测分析报告 ·原始测序数据 ·SV检测结果 ·sgRNA依赖型SV列表 ·SV注释结果 ·Circos可视化图 |
售后支持 | ·提供专业的报告解读和后续技术咨询 |
要求类别 | 项目 | 具体要求 |
|---|---|---|
样本送样要求 | 基因组 DNA (gDNA) | ·总量:≥ 2 µg (Qubit定量) |
细胞样本 | ·细胞量: ≥ 5 × 10⁶ 个细胞 | |
组织样本 | ·重量: ≥ 100 mg | |
必需信息 | sgRNA 信息 | ·完整的 20 nt sgRNA 序列 |
Cas 系统信息 | ·明确指出所使用的Cas蛋白类型(如SpCas9, SaCas9等) | |
样本信息 | ·清晰的样本编号 | |
交付周期 | 交付周期 | ·35-40个工作日 |
[1] Cosenza, M. R., et al.(2022). Structural Variation in Cancer: Role, Prevalence, and Mechanisms. Annu Rev Genomics Hum Genet.
[2] Ho, S. S., et al.(2020). The current landscape of structural variation detection tools. Briefings in Bioinformatics.
[3] Deamer, D., et al.(2016). Nanopores: a new tool for single-molecule analysis. Chemical Society Reviews.
[4] Li, H. (2018). Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics.
[5] Keskus, A. G., et al.(2025). Severus detects somatic structural variation and complex rearrangements in cancer genomes using long-read sequencing. Nat Biotechnol.
[6] Cancellieri, S., et al.(2023). Human genetic diversity alters off-target outcomes of therapeutic gene editing. Nat Genet.
[7] McLaren, W., et al.(2016). The Ensembl Variant Effect Predictor. Genome Biol.