iPSC WES遗传稳定性检测
1. 背景介绍
诱导多能干细胞(iPSCs)在再生医学、疾病模型和药物筛选等领域展现出巨大的应用潜力。然而,iPSCs在体外长期培养和传代过程中,不可避免地会累积各种遗传突变,这些突变可能影响其分化潜能、功能特性,甚至带来致病或致瘤风险,严重威胁其临床应用的安全性和有效性[1]。因此,对iPSCs在不同传代阶段的遗传稳定性进行动态监测和全面评估,是iPSCs质控和临床转化的关键环节。
全外显子组测序(Whole Exome Sequencing, WES)是一种高效、经济的遗传变异检测技术。它通过捕获基因组中的外显子区域(约占基因组的1-1.5%),能够以极高的深度(通常>100X)检测该区域的单核苷酸变异(SNV)和小的插入缺失(InDel)。由于超过85%的已知致病突变都位于外显子区域,WES成为了监测iPSCs遗传稳定性的理想工具[2]。
本方案基于WES技术,旨在为iPSCs提供一个科学、严谨、高性价比的遗传稳定性动态监测方案。通过对比不同传代次数(如P10、P20、P30)的iPSCs样本,不仅能够揭示遗传突变的累积规律,还能通过全面的生物信息学分析,深入评估这些突变的潜在功能影响、致病性和致瘤性风险,为iPSCs的质量控制、传代次数选择和临床应用安全性提供关键的科学依据。
在监管层面,中国CDE于2024年1月发布《人源干细胞产品非临床研究技术指导原则》,美国FDA于2024年发布《Safety Testing of Human Allogeneic Cells Expanded for Use in Cell-Based Medical Products》,两项权威指导文件均明确要求对干细胞产品开展系统性遗传稳定性检测,为本方案提供了重要的法规依据 [3, 4]。
2. 技术原理与分析流程
2.1 WES外显子捕获原理
WES的核心在于外显子捕获技术。该技术利用专门设计的生物素化探针,与打断后的基因组DNA文库进行液相杂交。这些探针能够特异性地结合到目标外显子区域。随后,通过磁珠(通常与链霉亲和素偶联)将结合了探针的DNA片段捕获下来,从而实现对外显子区域的富集。富集后的DNA片段经过测序,即可获得高深度的外显子序列信息。

2.2 iPSCs WES遗传稳定性检测流程
本方案的检测流程包括实验室建库测序和生物信息学分析两大阶段。核心在于对不同传代次数的iPSCs样本进行比较分析,以评估其遗传稳定性的动态变化。

2.3 核心分析逻辑:从突变累积到风险评估
2.3.1 不同代次的遗传突变累积分析
本方案的核心是通过比较不同传代次数的iPSCs样本(如P10、P20、P30)与初始对照样本(如成纤维细胞或低代次iPSCs),识别在传代过程中新出现的体细胞突变(Somatic Mutations)。
(1)变异检测:使用GATK Mutect2等高灵敏度的体细胞突变检测工具,对每个传代样本和对照样本进行配对分析,识别SNV和InDel;
(2)突变累积统计:统计每个传代样本中独有的、经过高质量过滤的变异数量。通过比较不同代次样本的变异数量,可以直观地评估遗传突变的累积趋势。通常,随着传代次数的增加,累积的变异数量会呈现上升趋势,这反映了iPSCs在培养过程中的遗传不稳定性。

如图3所示,随着iPSCs从低代次(P10)传代到高代次(P30),细胞中的突变负荷逐渐累积(红色点代表突变)。变异数量从P10的1274个增加到P30的1439个。同时,致病性变异的数量也在增加,从P10的2个增加到P20的3个,导致风险评估从低风险逐渐上升到高风险。这一趋势表明,需要对iPSCs的传代次数进行严格控制,以确保其遗传稳定性和临床应用安全性。
2.3.2 变异优先级分级与重要变异筛选
为了从数千个累积的变异中筛选出最值得关注的变异,我们建立了一套严格的优先级(Priority)分级和筛选标准。
优先级分级标准:
优先级 | 筛选条件 |
High | 位于外显子区域 + 造成氨基酸改变 + 在东亚人群中频率<0.01 + 至少一款预测软件认为有害 + 不在重复区域 |
Likelyhigh | 位于外显子或剪接区域 + 在东亚人群中频率<0.01 + 至少一款预测软件认为有害 + 不在重复区域 |
Medium | 位于外显子或剪接区域 + 在东亚人群中频率<0.01 + 不在重复区域 |
Low | 其他剩余的变异 |
重要变异筛选条件:
在上述分级的基础上,进一步筛选对细胞功能和安全性影响最大的“重要变异”:
(1)功能影响:去除同义突变(不改变氨基酸)和功能未知的变异;
(2)临床意义:基于ClinVar数据库,去除明确为“良性”(Benign)或“可能良性”(Likely Benign)的变异;
(3)疾病关联:基于OMIM数据库,去除与已知疾病无关的变异。
经过上述筛选,最终得到一个数量可控、高度富集了潜在有害突变的重要变异列表,为后续的人工审核和风险评估提供基础。
2.3.3 全面的变异注释与风险评估
对筛选出的重要变异进行全面的功能注释,是评估其潜在风险的关键。我们使用专业的注释工具ANNOVAR,整合数十个权威数据库,从多个维度对每个变异进行深入解析。
多维度注释体系:
注释类别 | 数据库示例 | 注释目的 |
基因区域注释 | RefSeq, Ensembl | 确定变异在基因组中的位置(外显子、内含子、UTR、启动子等)。 |
群体频率数据库 | gnomAD, 1000G, ExAC | 评估变异在普通人群中的频率,罕见变异更值得关注。 |
临床表型数据库 | ClinVar, OMIM | (致病性评估) 关联变异与已知遗传疾病和临床表型。 |
癌症相关数据库 | COSMIC | (致瘤性评估) 识别与癌症相关的体细胞突变。 |
功能预测算法 | SIFT, PolyPhen2, CADD | 预测非同义编码变异的潜在危害性。 |
通过这套全面的注释体系,我们可以实现以下三大核心评估目标:
(1)深入理解突变影响:明确每个变异的具体功能后果,区分良性变异和潜在的有害变异。
(2)评估致病致瘤性风险:识别与已知疾病或癌症相关的突变,为iPSCs的临床应用安全性提供关键依据。
(3)评估遗传稳定性:综合评估iPSCs在传代过程中是否积累了有害突变,为iPSCs的质控和传代次数选择提供科学指导。
3. 技术优势
优势维度 | 具体描述 |
动态监测遗传稳定性 | 通过对比不同传代次数的样本,能够动态监测iPSCs在培养过程中的遗传突变累积规律,为评估遗传稳定性提供直接证据。 |
极高的成本效益 | 聚焦于功能最重要的外显子区域,以WGS约1/10的成本,即可获得评估遗传稳定性的核心信息,特别适合多时间点的纵向研究。 |
高深度与高灵敏度 | 测序深度通常>100X,远高于WGS(30-50X),能够更灵敏地检测低频率的体细胞突变。 |
聚焦功能性变异 | 直接针对与蛋白质功能相关的外显子区域,检测到的变异更可能具有功能影响,分析目标明确。 |
全面的风险评估 | 整合数十个权威数据库进行全面注释,深入评估每个变异的潜在功能影响、致病性和致瘤性风险。 |
成熟的分析流程 | 采用国际主流的GATK工具和ANNOVAR注释流程,分析结果准确、可靠、可重复。 |
4. 应用场景
(1)iPSCs质量控制:作为iPSCs细胞株建立和传代过程中的常规质控手段。
(2)传代次数优化:通过监测不同代次的突变累积情况,为确定iPSCs的安全传代窗口提供科学依据。
(3)克隆筛选:在多个iPSC克隆中,筛选出遗传背景最稳定、突变负荷最低的优势克隆用于后续研究或应用。
(4)临床前安全性评估:作为iPSCs来源的细胞治疗产品在进入临床前必须进行的安全性评估的一部分。
(5)培养条件优化:比较不同培养体系或条件下iPSCs的遗传稳定性,筛选最优的培养方案。
5. 服务内容与送样要求
5.1 检测服务内容
服务阶段 | 服务内容 |
实验阶段 | 样本DNA质检、WES文库构建、外显子捕获、高通量测序(>100X) |
信息分析 | 原始数据质控、参考基因组比对、SNV/InDel检测、不同代次比较分析、突变累积统计、变异优先级分级、全面的功能注释与风险评估 |
交付内容 | 完整的检测报告、原始测序数据(FASTQ)、比对文件(BAM)、变异检测结果(VCF)、详细的变异注释表格 |
5.2 检测送样要求
类别 | 具体要求 |
基础服务选项 | ·可提供DNA提取与质检服务; · 可提供PCR-free文库构建与测序服务(客户需提供高质量DNA样本); · 可单独提供数据分析服务(客户需提供原始FASTQ文件)。 |
细胞样本标准 | · 细胞数量:最低1×10⁶个,推荐≥5×10⁶个; ·活性要求:细胞活率≥80%; ·运输条件:干冰运输,全程冷冻; ·完整性:细胞形态正常,无明显破碎。 |
DNA样本标准 | ·DNA总量:≥2μg,Qubit定量; ·浓度要求:≥50ng/μL; ·纯度要求:OD260/280=1.8–2.0,OD260/230≥1.8; · 完整性:电泳主带>10kb,无明显降解; ·运输条件:-20°C冰袋运输。 |
对照样本要求 | ·提供未编辑的亲本iPSCs作为对照,用于过滤背景变异;对照样本需与实验样本同批次、相同培养条件,质量标准一致。 |
客户其他信息 | ·样本类型及名称; ·实验设计与分组信息; ·iPSCs来源、培养条件、传代次数等。 |
6. 参考文献
[1] Abyzov, A., et al. (2012). Somatic copy number mosaicism in human skin revealed by induced pluripotent stem cells. Nature, 492(7429), 438-442.
[2] Choi, M., et al. (2009). Genetic diagnosis by whole exome capture and massively parallel DNA sequencing. Proceedings of the National Academy of Sciences, 106(45), 19096-19101.
[3] 国家药品监督管理局药品审评中心(CDE). 人源干细胞产品非临床研究技术指导原则[S]. 2024-01.
[4] U.S. Food and Drug Administration (FDA). Safety Testing of Human Allogeneic Cells Expanded for Use in Cell-Based Medical Products [EB/OL]. 2024.
[5] Gore, A., et al. (2011). Somatic coding mutations in human induced pluripotent stem cells. Nature, 471(7336), 63-67.
[6] Martins-Taylor, K., & Nisler, B. S. (2018). A review of genomic and epigenomic stability of human induced pluripotent stem cells. Stem cell reviews and reports, 14(5), 625-634.