CRISPRme软件脱靶预测
1. 背景介绍
CRISPR基因编辑技术在疾病治疗和基础研究中展现出巨大潜力,但脱靶效应一直是限制其临床转化的核心安全性挑战。精准预测脱靶风险已成为推动基因编辑技术从基础研究到临床转化全过程的决定性因素。
FDA在其最新发布的人类基因治疗产品指南中明确强调,评估基因编辑产品安全性需采用多种互补方法共同验证,特别指出计算机软件预测("in silico"方法)是脱靶风险评估的首要环节。传统脱靶预测工具(如Cas-OFFinder、CRISPOR)仅基于参考基因组分析,忽略了遗传变异对脱靶风险的影响,这在多样性人群中可能导致严重的风险低估。
CRISPRme作为新一代脱靶预测工具,突破了传统方法的局限,整合了1000 Genomes Project和HGDP等大规模遗传变异数据库,能够识别个体特异性的潜在脱靶位点,为基因编辑安全性评估提供了更全面、更精准的解决方案。
2. CRISPRme技术原理
CRISPRme采用创新的单倍型感知算法,不仅考虑参考基因组,还整合了遗传变异信息(SNVs/Indels),通过以下核心技术实现全面的脱靶风险评估:
(1)高效基因组索引: 构建包含参考基因组和变异基因组的全基因组索引,支持快速检索潜在脱靶位点;
(2)单倍型感知靶点提名: 系统识别由遗传变异创建或消除的脱靶位点,评估个体特异性风险;
(3)多维度评分体系: 整合CFD评分、CRISTA评分和序列同源性评分,提供全方位脱靶风险量化;
(4)多PAM类型分析: 覆盖NGG(经典PAM)、NAG和NGA(非经典PAM),全面评估不同PAM序列条件下的脱靶风险。

图1 CRISPRme软件预测原理图
3. CRISPRme技术创新与优势
3.1 核心技术创新
3.1.1 个体化风险评估
整合1000 Genomes Project(2,504个个体,26个群体)和HGDP(1,043个个体,54个族群)的大规模遗传变异数据,能够:
(1)识别由SNVs/Indels创建的新脱靶位点(风险上升);
(2)识别由变异消除的脱靶位点(风险下降);
(3) 提供针对不同族群和个体的特异性风险评估。
3.1.2 全面PAM覆盖策略
SpCas9可识别多种PAM序列,其结合亲和力和切割效率存在显著差异,CRISPRme同时分析所有PAM类型,确保全面评估脱靶风险。
(1)NGG(经典PAM):切割效率~100%,脱靶风险最高;
(2)NAG(非经典PAM): 相对切割效率20-50%;
(3)NGA(非经典PAM):相对切割效率5-20%。
3.1.3 多维度生物信息学分析
整合专业的生物信息学分析流程,实现:
(1)精确鉴定脱靶位点的染色体坐标和功能特征;
(2)种子区域(PAM端10bp)错配分析;
(3)变异导致的脱靶风险变化定量评估。
4. 应用场景与服务优势
4.1 应用场景
CRISPRme在CRISPR基因编辑产品研发与监管过程中的应用场景广泛:
(1)sgRNA设计优化: 在sgRNA设计阶段进行全面脱靶预测,筛选低脱靶风险的候选sgRNA;
(2)基因治疗产品安全性评价: 精确评估CRISPR基因编辑产品的脱靶风险,识别高风险脱靶位点;
(3)IND申报支持: 提供符合FDA和NMPA要求的计算机预测分析报告,支持临床试验申请;
(4)个体化精准医疗: 基于患者个体遗传背景评估脱靶风险,为个体化基因治疗方案提供支持;
(5)临床前研究: 协助设计脱靶验证实验,指导湿实验验证策略。
4.2 服务优势
(1)技术先进: 采用最新版CRISPRme v2.1.3(2024年12月发布),整合最新遗传变异数据库;
(2)分析全面: 覆盖NGG、NAG、NGA三种PAM类型,提供参考基因组和变异基因组的双重分析;
(3)报告规范: 提供符合FDA和NMPA指导原则要求的标准化分析报告,全面支持监管申报;
(4)个性化服务: 可根据客户需求提供定制化分析和技术支持。
5. CRISPRme脱靶预测示例报告
我们提供符合监管要求的全面CRISPRme脱靶预测分析报告,包含详细的分析平台信息、sgRNA序列信息、遗传变异数据库说明及分析流程描述等基础信息。除此之外,报告还包含以下核心内容:
(1)脱靶位点数量统计:
针对每个sgRNA和每种PAM类型,提供不同错配与bulge条件下的脱靶位点数量统计,包括参考基因组、变异基因组及合并后的位点总数。系统展示bulge类型(DNA/RNA/无)、错配数量、bulge数量及对应的脱靶位点数量,为脱靶风险评估提供定量依据。

图2 脱靶位点数量统计示例
(2)脱靶风险前50位点详细信息:
基于CFD评分对所有脱靶位点进行降序排序,展示脱靶风险最高的前50个位点的详细信息,包括:染色体定位、起始坐标、DNA链方向、PAM序列、错配数、bulge数、参考基因组CFD评分、变异基因组CFD评分及最高CFD评分。同时提供这些高风险位点的种子区域(PAM端10bp)比对信息,展示种子区和非种子区的错配与bulge分布情况。

图3 脱靶风险最高的前50个位点的详细信息示例
(3)变异导致的脱靶风险变化分析:
通过计算变异前后CFD评分的差值,系统识别并展示:
①脱靶风险上升位点(Top 50): 由遗传变异创建或增强的脱靶位点,提供变异信息(位置、类型、等位基因频率、rsID)、PAM创建情况及风险评分变化;

图4 脱靶风险上升位点(Top 50)示例
② 脱靶风险下降位点(Top 50): 由遗传变异消除或减弱的脱靶位点,帮助识别特定群体中的保护性变异。

图5 脱靶风险下降位点(Top 50)示例
(4)多PAM去重和标准染色体筛选:对NGG、NAG、NGA三种PAM类型的预测结果进行去重处理,并筛选标准染色体(chr1-22, X, Y)上的脱靶位点,提供去重前后及筛选后的位点数量统计,确保分析结果的准确性和可比性。

图6 多PAM去重和标准染色体筛选示例
6. CRISPRme脱靶预测服务内容
服务流程 | 服务内容 |
项目咨询与评估 | 制定个性化分析方案,进行项目报价 |
信息收集 | 收集sgRNA序列信息(序列、PAM类型、基因组定位等) |
CRISPRme分析 | 执行标准化分析流程:参考基因组hg38、变异数据库整合(1000G + HGDP)、多PAM类型分析(NGG/NAG/NGA)、CFD评分计算、种子区域分析、变异风险评估 |
专业报告交付 | 提供标准化分析报告,含技术解读与咨询服务 |
IND申报支持 | 可按客户需求提供符合FDA和NMPA要求的技术文档 |
*服务周期:标准流程5-10个工作日;
7. 信息要求
类别 | 具体要求 |
基础服务选项 | 可提供CRISPRme脱靶预测与分析服务(客户提供sgRNA序列信息) |
sgRNA序列信息 | sgRNA序列(20bp spacer序列); PAM序列(如NGG、NAG等); 基因组定位信息(染色体、起始位置、终止位置、链方向); 靶基因名称(可选)。 |
分析参数 | 参考基因组:CRISPRme 参考基因组(标准); PAM类型:NGG/NAG/NGA(标准覆盖所有);错配容忍度:≤5个错配,≤1个bulge(标准);变异数据库:1000 Genomes + HGDP(标准)。 |
*注: ① 所有分析参数均可根据客户需求进行调整和定制;② 对于特殊分析需求,请提前与技术团队沟通(电话 15336557985;产品订购/技术支持 service@generulor.com)。
8. 参考文献
[1] Cancellieri S, Zeng J, Lin LY, et al. Human genetic diversity alters off-target outcomes of therapeutic gene editing. Nat Genet. 2023;55(1):34-43. doi:10.1038/s41588-022-01257-y
[2] U.S. Food and Drug Administration. (2024). Human Gene Therapy Products Incorporating Human Genome Editing - Guidance for Industry.
[3] 国家药品监督管理局药品审评中心. (2022). 体内基因治疗产品药学研究与评价技术指导原则(试行)。