《1、 引言》

1、 引言

结核病是单一传染性疾病的主要死因之一,2018年,全球共有1000万人感染结核分枝杆菌,其中共有145万人因此死亡[1]。目前,耐药结核病的治疗指南提出,结核病患者需要同时使用4种一线药物进行6个月的治疗。此外,耐多药结核病和完全耐药结核病的病情日益严重,给结核病治疗带来了巨大的困难[23]。因此,期待尽快开发出一种快速并且有效的结核病治疗的新型策略。

简便、精确、无痕的遗传操作方法能够快速地鉴定和表征结核分枝杆菌的药物靶点,能够加速新型结核病治疗策略的开发。目前用于结核分枝杆菌遗传操作的方法包括:长片段线性化DNA等位交换[4]、基于分枝杆菌噬菌体的位点特异性重组[5]、噬菌体重组系统介导的重组[6]、Bxb1整合酶在寡核苷酸介导的重组位点进行的位点特异性整合[7]、双链断裂诱导的非同源末端连接(NHEJ)[8]。上述方法需要花费数月到一年的时间用于多次转化,或者只能产生非精确突变,因此不适合在单个碱基分辨率下进行基因功能研究。

最近,在多种生物体(包括真核细胞)中[917],规律成簇的间隔短回文重复序列(CRISPR)和CRISPR相关蛋白(Cas)已经被用于快速、精确的基因编辑。通过与前间隔序列邻近基序(PAM)附近的DNA序列进行碱基互补配对,Cas/引导RNA(gRNA)复合物能够特异性地结合靶向位点,并产生双链DNA断裂。在细胞内同源重组修复(HDR)或非同源末端连接通路的帮助下,可以快速地实现精确的或不精确的遗传操作。此外,CRISPR-Cas系统可以进一步工程化为基因敲低的转录抑制(CRISPRi)系统,并不依赖于细胞DNA的修复机制[1819]。在结核分枝杆菌中,CRISPR协助的非同源末端连接[8]和CRISPRi [2023]系统分别被用于不精确的基因编辑和基因敲低。尽管上述遗传操作方法非常好用,然而,目前结核分枝杆菌里没有精确、完全的基因失活方法;这是因为缺少能在结核分枝杆菌里与CRISPR-Cas系统兼容的同源重组修复系统。

最近,胞嘧啶碱基编辑器(CBE)和腺嘌呤碱基编辑器(ABE)已经被用于精确的基因编辑[2426]。碱基编辑器由核苷酸脱氨酶和催化失活的或催化受损的Cas9构成,能够直接将C转化为T或将A转化为G;由于它们不依赖同源重组修复系统,因此,碱基编辑器被广泛用于多种具有不同遗传背景的微生物的遗传操作中[2735]。然而,目前没有可以用于结核分枝杆菌的碱基编辑系统。

在这项研究中,在耻垢分枝杆菌中开发并表征了CTBE和CGBE,并将CTBE用于结核分枝杆菌的基因编辑。通过筛选不同的CRISPR碱基编辑器,发现只有不常用的嗜热链球菌Cas9(St1Cas9)胞嘧啶碱基编辑器是有活性的,而广泛使用的酿脓链球菌Cas9(SpCas9)或毛螺科菌Cpf1(LbCpf1)胞嘧啶碱基编辑器在耻垢分枝杆菌中是不具有活性的。通过对St1Cas9胞嘧啶碱基编辑器(St1Cas9 CBE)与尿嘧啶-N-糖基化酶抑制剂(UGI)或尿嘧啶-N-糖基化酶(UNG)进行融合,并对St1Cas9进行PAM扩展,获得了C到T的碱基编辑器和C到G的碱基编辑器,它们的产物纯度和靶向范围都得到了提高,并且能进行多基因碱基编辑。此外,使用全基因组测序的方法表征了C到T碱基编辑器的脱靶情况,在耻垢分枝杆菌中没有观察到脱靶现象。本文的基因编辑系统仅包含单个质粒,通过单次转化就能实现有效、无痕的基因编辑,显著减少了在分枝杆菌中进行遗传操作所需要的劳动和时间。

《2、 材料和方法》

2、 材料和方法

《2.1 细菌菌株和培养条件》

2.1 细菌菌株和培养条件

本研究中使用的菌株详见附录A中的表S1,使用的试剂详见附录A中的表S2。用于质粒构建的大肠杆菌(E. coli)TOP10在Luria-Bertani(LB)肉汤中培养,培养温度为37 °C。实验中使用了结核分枝杆菌H37Rv、耻垢分枝杆菌mc2155和它们的衍生菌株。结核分枝杆菌和耻垢分枝杆菌在添加了0.2%甘油、0.05% Tween 80及1 ×白蛋白葡萄糖过氧化氢酶(ADC)(耻垢分枝杆菌)或1 × 油酸白蛋白葡萄糖过氧化氢酶(OADC)(结核分枝杆菌)的Middlebrook 7H9肉汤或7H10平板上培养,培养温度为37 °C。实验中使用的抗生素或化学药品的浓度如下:耻垢分枝杆菌和结核分枝杆菌使用的卡那霉素为20 μg∙mL-1E. coli TOP10使用的卡那霉素为50 μg∙mL-1;亮氨酸为50 μg∙mL-1;异烟肼(INH)为16 μg∙mL-1;脱水四环素(ATc)为20 ng∙mL-1

《2.2 质粒构建》

2.2 质粒构建

用于质粒构建的引物详见附录A中的表S3,本研究中使用的质粒详见附录A中的表S4。

《2.2.1. 构建CBE_dSt1Cas9、CBE_dSpCas9和CBE_dLbCpf1质粒》

2.2.1. 构建CBE_dSt1Cas9、CBE_dSpCas9和CBE_dLbCpf1质粒

以J23119启动子表达单引导RNA(sgRNA)的表达盒由GENEWIZ公司(中国)合成,并使用T4 DNA连接酶连接到pLJR962 [22]骨架(通过Esp3I和SapI线性化)中。APOBEC1基因通过聚合酶链反应(PCR)从pBECKP [33]质粒上扩增,并通过Gibson连接[36]连接到pLJR962骨架中,得到CBE_dSt1Cas9质粒。APOBEC1dSt1Cas9之间使用一段32氨基酸的连接器进行连接,使用ATc诱导型启动子控制APOBEC1-dSt1Cas9融合蛋白的表达,CBE_dSpCas9和CBE_dLbCpf1质粒采取了和CBE_dSt1Cas9质粒相同的构建策略。

《2.2.2. 构建pMF1_CBE_dSt1Cas9、pJAZ38_CBE_dSt1Cas9和pAL5000_CBE_dSt1Cas9质粒》

2.2.2. 构建pMF1_CBE_dSt1Cas9、pJAZ38_CBE_dSt1Cas9和pAL5000_CBE_dSt1Cas9质粒

通过PCR从pYC1640扩增pMF1复制子和TetR基因,通过Gibson连接克隆到pLJR962_CBE_dSt1Cas9质粒上,获得pMF1_CBE_dSt1Cas9质粒。pJAZ38_CBE_dSt1Cas9和pAL5000_CBE_dSt1Cas9质粒采取了相似的构建策略。

《2.2.3. 构建pMF1_CTBE_cons、pMF1_CGBE_cons、pMF1_CTBE_cons和pMF1_CGBE_cons质粒》

2.2.3. 构建pMF1_CTBE_cons、pMF1_CGBE_cons、pMF1_CTBE_cons和pMF1_CGBE_cons质粒

UGI基因由Sangon公司(中国)合成,通过Gibson连接克隆到pJLR962_CBE_dSt1Cas9质粒中。通过PCR从pYC1640扩增pMF1复制子和TetR基因,通过Gibson连接克隆到上述质粒中,获得pMF1_CTBE_cons质粒。通过PCR从E. coli MG1655基因组中扩增E. coli UNG(eUNG)基因,并通过Gibson连接克隆到pMF1_CBE_dSt1Cas9 质粒的骨架中,获得pMF1_CGBE_cons质粒。D939K/E1057Q/N1081K/K1086L突变通过Gibson连接引入pMF1_CTBE_cons质粒中,获得pMF1_CTBEengineer_cons质粒。通过PCR从pMF1_CTBEengineer_cons扩增APOBEC1-dSt1Cas9(D939K/E1057Q/N1081K/K1086L),通过Gibson连接克隆到pMF1_CGBE_cons质粒中,获得pMF1_CGBEengineer_cons质粒。这些质粒用于耻垢分枝杆菌的碱基编辑。

《2.2.4. 构建pMF1_CTBE质粒》

2.2.4. 构建pMF1_CTBE质粒

通过Gibson连接在pMF1_CTBEengineer_cons质粒中加入以Tet启动子表达单引导sgRNA的表达核,获得pMF1_CTBEengineer_cons质粒。在这个质粒中,APOBEC1-dSt1Cas9-UGI和sgRNA都采用了诱导型启动子,通过ATc控制其表达。这些质粒用于结核分枝杆菌的基因编辑。

《2.3 感受态细胞准备与电转》

2.3 感受态细胞准备与电转

结核分枝杆菌H37Rv(ATCC27294)从-80 ℃环境下取出后,在Lowenstein-Jensen slant上划线,并在37 °C培养箱中培养两周;之后,在添加了0.2%甘油、0.05% Tween 80及1 × OADC的Middlebrook 7H9肉汤中培养两周。将细菌悬液在冰上冷却5 min后,通过离心收集菌体。使用30 mL预冷的10%甘油将菌体洗涤两次,之后将菌体重悬在5 mL预冷的10%甘油中。电转时使用Gene Pulser Xcell Electroporation系统(Bio-Rad,美国)和0.2 cm的电击杯,电转参数为:2.5 kV、1000 Ω、25 μF。向100 μL感受态细胞中加入1 μg质粒,电转后加入1 mL添加了OADC的7H9肉汤,在37 °C摇床中培养2 d。将菌悬液转移至添加了OADC的Middlebrook 7H10琼脂上,并用封口膜进行密封,在37 °C下培养20~30 d。

耻垢分枝杆菌mc2155(ATCC700084)从-80 ℃环境下取出后,在添加了ADC的7H10平板上划线,并在37 °C培养4 d;之后,在添加了0.2%甘油、0.05% Tween 80及1 × ADC的Middlebrook 7H9肉汤中培养一天。将细菌按1∶100稀释到添加了ADC的100 mL Middlebrook 7H9肉汤中,并在37 °C摇床培养12~15 h。待OD600 = 0.8~1时,将细菌在冰上冷却20 min,之后以4000 r∙min-1离心10 min收集菌体,并用30 mL预冷的10%甘油将菌体洗涤两次。电转时使用Gene Pulser Xcell Electroporation系统(Bio-Rad,美国)和0.2 cm的电击杯,电转参数为:2.5 kV、1000 Ω、25 μF。向100 μL感受态细胞中加入100 ng质粒,电转后加入1 mL添加了ADC的7H9肉汤,在37 °C摇床中培养3 h。将10%的细菌转移到添加了ADC的Middlebrook 7H10琼脂上,并用封口膜进行密封,在37 °C培养7~10 d。

《2.4 表征编辑效率》

2.4 表征编辑效率

本研究使用的sgRNA靶点信息详见附录A中的表S5。电转后,平板经封口膜密封后在37 °C培养箱中进行培养。耻垢分枝杆菌或结核分枝杆菌平板上所有的菌落都被收集起来,通过Rapid Bacterial Genomic DNA Isolation Kit(Sangon Biotech,中国)提取基因组。使用Easy Taq DNA Polymerase(TransGen,中国)通过PCR扩增靶向区域,并进行Sanger测序,之后使用EditR 1.0.10 [37] 计算编辑效率。

《2.5 使用CTBE对leuB或leuC进行敲除》

2.5 使用CTBE对leuB或leuC进行敲除

将插入spacer的CTBEengineer质粒电转进耻垢分枝杆菌mc2155感受态细胞,电转后加入1 mL添加了ADC的7H9肉汤,在37 °C摇床中培养3 h。将10%的细菌转移到添加了ADC的Middlebrook 7H10琼脂(20 ng‍∙‍mL-1 ATc、50 μg∙mL-1亮氨酸、20 μg∙mL-1卡那霉素)上,并用封口膜进行密封,在37 °C下培养7 d。使用2.4节中的方法对基因编辑的效率进行表征,之后,挑选单克隆菌落至添加了ADC和亮氨酸的2 mL 7H9肉汤(不含卡那霉素)中培养2天。随后将细菌培养在添加了ADC和亮氨酸的Middlebrook 7H10琼脂上。通过测序分离出leuBleuC的突变菌株。

《2.6 质粒消除》

2.6 质粒消除

挑选单克隆至添加了ADC的7H9肉汤(不含卡那霉素)中培养,等细菌生长到平台期(大约4 d)时,将细菌培养在添加了ADC的Middlebrook 7H10琼脂(不含卡那霉素)上。将单克隆菌落稀释到5 mL 7H9肉汤中,一部分细菌培养在添加了ADC和卡那霉素的7H10平板上,另一部分细菌培养在添加了ADC但不含有卡那霉素的7H10平板上。质粒被消除的细菌只能在添加了ADC但不含有卡那霉素的7H10平板上生长。

《2.7 亮氨酸营养缺陷实验》

2.7 亮氨酸营养缺陷实验

leuBleuC的失活是通过利用CTBEengineer质粒引入终止密码子来实现的。这些菌株在含有ADC和亮氨酸的Middlebrook 7H9肉汤中被培养到平台期,其中一部分细菌培养在含有ADC和亮氨酸的Middlebrook 7H10琼脂上,另一部分细菌培养在含有ADC但不含有亮氨酸的Middlebrook 7H10琼脂上。平板用封口膜进行密封,在37 °C下培养4 d。

《2.8 异烟肼抗性实验》

2.8 异烟肼抗性实验

katG的失活是通过利用CTBEengineer质粒在Gln3(CAA到TAA)处引入终止密码子来实现的。这些菌株在含有OADC和亮氨酸的Middlebrook 7H9肉汤中被培养到平台期,一部分细菌培养在含有OADC和异烟肼(16 μg∙mL-1)的Middlebrook 7H10琼脂上,另一部分细菌培养在含有OADC但不含有异烟肼的Middlebrook 7H10琼脂上。平板用封口膜进行密封,在37 °C下培养20 d。

《2.9 聚集试验》

2.9 聚集试验

ctpE的失活是通过利用CTBEengineer质粒在Gln16(CAG到TAG)处引入终止密码子来实现的。将这一菌株在含有ADC的Middlebrook 7H9肉汤中培养到对数期,一部分按照1∶100的比例稀释到含有ADC和乙二醇双(2-氨基乙醚)四乙酸(EGTA)(1.0 mmol∙L-1)的Middlebrook 7H9肉汤中,按照1∶100的比例稀释到含有ADC但不含有EGTA的Middlebrook 7H9肉汤中。细菌在37 °C、200 r∙min-1的摇床中培养48 h。之后,将细菌取出,室温下静置一小时。

《2.10 全基因组测序》

2.10 全基因组测序

将野生型和两个突变菌株送到GENEWIZ公司,在Illumina HiSeq/Nova 2 × 150 bp平台进行全基因组测序。文库按照Illumina HiSeq/Nova 2 × 150 bp平台的标准实验方案进行测序。获得的数据使用cutadapt(v1.9.1)软件进行处理,并使用BWA(v0.7.17)软件与参考基因组(Accession number: NC_008596)进行比对。输出的文件使用Picard和Genome Analysis Toolkit(GATK)进行去重复、局部重新比对和碱基质量再校准。通过GATK提供的Haplotype Caller模块对单核苷酸突变进行检测,并使用Excel(Microsoft,美国)进行管理。得到的单核苷酸突变与含有近PAM端1~8核苷酸相同序列的潜在的脱靶位点进行比较,对脱靶效应进行评估。

《2.11 准备sgRNA》

2.11 准备sgRNA

转录使用的sgRNA模板(双链DNA)由GENEWIZ公司(中国)合成,并使用PCR扩增该模板。使用HiScribe T7 High Yield RNA Synthesis Kit(NEB,美国)对sgRNA进行体外转录。37 °C下反应过夜后,加入deoxyribonuclease I(DNase I)来降解模板DNA。随后,使用酚氯仿抽提的方法对转录出的sgRNA进行纯化,并将纯化好的sgRNA储存在-80 °C的条件下。

《2.12 St1Cas9蛋白的体外切割实验》

2.12 St1Cas9蛋白的体外切割实验

蛋白质的准备和切割实验的操作都按照之前的研究[43]方法进行。将含有AAAGAA PAM和spacer的一段序列克隆到基于pUC19的质粒中(简写为pUC19-AGAA)。通过定点突变的方法获得具有不同PAM的质粒(详见附表A中的表S6)。将含有不同PAM的质粒用Kpn1进行酶切线性化,随后使用TIANquick Midi Purification Kit(TIANGEN,中国)对线性化的质粒进行纯化。在体外切割实验中,各种试剂的浓度如下:St1Cas9及其突变体(250 nmol∙L-1)、sgRNA(500 nmol∙L-1)、Tris-HCl(pH = 7.5;10 mmol∙L-1)、氯化钠(500 mmol∙L-1)、氯化镁(1.5 mmol∙L-1)、二硫苏糖醇(DTT)(1 mmol∙L-1);另外,线性化的质粒浓度为5 nmol∙L-1。体外切割实验在37 °C下反应40 min后,立即转移到液氮中。随后加入10 μg Proteinase K,并补充EDTA到25 mmol∙L-1,使切割反应停止。将反应在58 °C下放置10 min后,使用1%的琼脂糖凝胶对反应产物进行分析。核酸使用4S Red Plus(Sangon Biotech,中国)进行染色,使用的可视化软件为ChemiDoc MP System(Bio-Rad,美国)。

《3、 结果和讨论》

3、 结果和讨论

《3.1 鉴定在耻垢分枝杆菌里有活性的碱基编辑器》

3.1 鉴定在耻垢分枝杆菌里有活性的碱基编辑器

SpCas9已被广泛应用于许多微生物的遗传操作[16,29,3841]。但由于其明显的细胞毒性和较低的DNA靶向效率,限制了SpCas9在分枝杆菌中的应用[8,22]。为了在分枝杆菌中构建有活性的CBE,筛选了由大鼠APOBEC1胞嘧啶脱氨酶和不同Cas核酸酶融合而成的多种CBE,包括dSpCas9(无催化活性的SpCas9)、dLbCpf1(无催化活性的毛螺科菌Cpf1)和dSt1Cas9(无催化活性的St1Cas9)。Cas核酸酶的表达由ATc诱导型启动子控制,而相应的gRNA的表达由组成型启动子J23119控制。

为了定量评估上述几种碱基编辑的效率,将相同质量的CBE质粒分别电转到耻垢分枝杆菌中。在所有的测试位点中,CBEdSt1Cas9(CBE_dSt1Cas9)能将C编辑为T(编辑效率为4%~15%),同时也将C编辑为非预期的G(编辑效率为18%~70%)。而CBEdSpCas9(dSpCas9 CBE)和CBEdLbCpf1(dLbCpf1 CBE)在所有测试位点的编辑效率都小于10% [图1(a)]。此外,与之前的研究[4243]相同,CBEdSt1Cas9或CBEdLbCpf1在耻垢分枝杆菌中没有明显的细胞毒性,而CBEdSpCas9具有明显的细胞毒性[图1(b)]。因此,选择CBEdSt1Cas9用于后续的工程化研究。为了在基因编辑之后对质粒进行消除,本研究将整合型L5骨架替换为pMF1骨架。研究发现,基于pMF1骨架的CBEdSt1Cas9没有明显的细胞毒性,在没有抗生素的情况下,可以容易地在无抗生素的培养基中进行质粒消除[见附录A中的图S1(a)、(b)和图S2(a)、(b)]。

《图1》

图1 在耻垢分枝杆菌中的基于St1Cas9的碱基编辑。(a)鉴定在耻垢分枝杆菌中有活性的CRISPR碱基编辑器。筛选了嗜热链球菌Cas9胞嘧啶碱基编辑器(CBE_dSt1Cas9)、酿脓链球菌Cas9胞嘧啶碱基编辑器(CBE_dSpCas9)和毛螺科菌Cpf1胞嘧啶碱基编辑器(CBE_dLbCpf1)。APOBEC1胞嘧啶脱氨酶通过32氨基酸的linker连接到Cas核酸酶的N端。(b)不同碱基编辑器在耻垢分枝杆菌中的转化效率;电转时使用的质粒都是100 ng。(c)胞嘧啶脱氨后可能的细胞DNA修复机制。最初的编辑产物U∶G错配对可以通过DNA修复和复制的方式直接转化为T∶A碱基对,被细胞内的UNG切除,从而形成多种编辑产物。UGI能够抑制细胞内UNG的活性。(d)、(e)St1Cas9 CBE融合了UGI或UNG,产生两个新的碱基编辑器,CTBE(d)和CGBE(e)能够在耻垢分枝杆菌中进行C到T或C到G的编辑,且产物纯度大大提高。

《3.2 在耻垢分枝杆菌中开发CTBE和CGBE》

3.2 在耻垢分枝杆菌中开发CTBE和CGBE

细胞中的G∶U错配对通常通过尿嘧啶-N-糖基化酶介导的碱基切除修复通路进行修复。抑制UNG的活性可以保护碱基编辑后的G∶U中间体不被修复,从而提高C到T的编辑效率和产物纯度[24,44] [图1(c)]。将两个UGI融合到dSt1Cas9的C端,以创建C到T碱基编辑器(CTBEWT)。为了检测CTBEWT将C编辑为T的效率,在耻垢分枝杆菌中挑选了5个基因组位点对CTBEWT进行表征。CTBEWT具有较高的C到T的基因编辑效率(69%~86%),并且显著地减少了副产物的生成[图1(d)]。

近期研究发现,通过在SpCas9 CBE中融合UNG或其他DNA修复蛋白,强化碱基切除修复通路,可以将靶标C∶G碱基对转化为G∶C或A∶T碱基对,而不是预期的T∶A碱基对[4548]。考虑到使用CBEdSt1Cas9时产生了大量的C到G非预期产物,预计将UNG与CBEdSt1Cas9融合会产生新的碱基编辑器。因此,本文将来源于大肠杆菌的eUNG融合到CBEdSt1Cas9中dSt1Cas9的C端,创建了一个新的碱基编辑器CGBEWT,并比较了CGBEWT和CBEdSt1Cas9的碱基编辑效率。如图1(e)所示,在所有5个测试位点中,CGBEWT都能有效实现C到G的编辑,并且产物的纯度得到了提高。

《3.3 开发用于碱基编辑器的PAM扩展型St1Cas9》

3.3 开发用于碱基编辑器的PAM扩展型St1Cas9

St1Cas9靶向DNA需要识别相对严格的PAM序列(5′-NNRGAA-3′,其中R为A或G)[43],这大大限制了CTBEWT和CGBEWT的编辑范围。之前通过在St1Cas9中引入D939K/E1057L/N1081K/K1086L突变,构建了St1Cas9突变体(KLKL),以降低St1Cas9对PAM相对严格的要求[43]。在野生型St1Cas9中,Q1084和K1086能够分别与5′-NNAGGA-3′ PAM的第三位A和第四位G形成两根氢键,而E1057则通过氢键进一步稳定Q1084 [图2(a)]。E1057L和K1086L突变会破坏原有氨基酸与碱基的相互作用,而D939K和N1081K突变会引入非碱基特异性相互作用[43]。最近在体外切割实验中发现,在KLKL中引入L1057Q突变会增强St1Cas9对含有5′-NNTTAA-3′ PAM和5′-NNCTAA-3′的DNA的切割活性[图2(b)]。因此,本文设计了一个包含D939K/E1057Q/N1081K/K1086L突变的St1Cas9突变体(KQKL),以进一步降低St1Cas9对PAM的要求。体外DNA切割实验表明,与野生型St1Cas9识别5′-NNRGAA-3′ PAM相比,KQKL识别5′-NNNNAA-3′ PAM,进一步扩展了St1Cas9的PAM识别范围[图2(c)]。

《图2》

图2 通过结构导向的工程化扩展St1Cas9的PAM。(a)野生型St1Cas9的PAM识别机制(PDB: 6M0X);(b)两种St1Cas9突变体的体外DNA切割实验;(c)野生型St1Cas9和St1Cas9突变体(KQKL)的体外DNA切割实验。

接下来,将CTBEWT中的野生型St1Cas9替换为KQKL(将新的碱基编辑器命名为CTBEengineer),以扩大从C到T碱基编辑器的靶向范围[图3(a)]。由于效应蛋白使用了ATc诱导型启动子,首先对诱导剂ATc的浓度进行了优化。筛选了6种不同的ATc浓度,范围从5 ng∙mL-1到100 ng∙mL-1,发现其对编辑效率没有明显的影响(见附录A中的图S3)。在后续实验中,使用的ATc浓度为20 ng∙mL-1

《图3》

图3 耻垢分枝杆菌中CTBE和CGBE的综合表征。(a)不同St1Cas9胞嘧啶碱基编辑器的构成。(b)耻垢分枝杆菌中CTBEwt和CTBEengineer编辑活性的比较(条形图代表编辑窗口内最高的编辑效率)。(c)、(d)CTBEengineer的编辑窗口和CGBEengineer的编辑窗口。(e)耻垢分枝杆菌中的亮氨酸合成通路。被靶向的基因(leuCleuB)标记为红色(α-KIV; α-ketoisovalerate; α-IPM; α-isopropylmalate; IPM; 3-isopropylmalate)。(f)利用CTBEengineerleuBleuC中生成过早的终止密码子进行基因失活。在缺乏亮氨酸的情况下,leuBleuC的失活使耻垢分枝杆菌出现营养缺陷表型。方框和反义方框分别表示目标序列和PAM。

为了系统地表征CTBEengineer在体内的PAM偏向性,针对48个不同的基因组位点设计了48个sgRNA,每种5′-NNNNAA-3′ PAM用三个基因组位点进行表征。在转化后收集所有菌落,提取基因组并对目标位点进行PCR扩增,将包含目标位点的PCR产物进行测序,以评估编辑效率。与体外DNA切割实验一致,体内实验测得CTBEengineer识别具有5′-NNNNAA-3′ PAM的位点[图3(b)]。研究发现,在PAM活性较低的位点,如5′-NNTAAA-3′、5′-NNTCAA-3′、5′-NNTGAA-3′和5′-NNTTAA-3′,spacer的序列会显著影响CTBEengineer的编辑效率[图3(b)]。此外,分析了CTBEengineer的编辑窗口,发现CTBEengineer更偏向于编辑4~12位窗口中的胞嘧啶[图3(c)]。当胞嘧啶在4~12位之外,在2~15位之内时,仍然可以被高效地编辑[图3(c)]。

将CGBEWT中的野生型St1Cas9替换为KQKL(新的碱基编辑器被命名为CGBEengineer)[图3(a)]。通过检测29个基因组位点的编辑效率,对CGBEengineer进行了综合的表征。有趣的是,虽然CTBEengineer和CGBEengineer使用了相同的Cas蛋白和脱氨酶,但只有5~8位窗口中的胞嘧啶可以用CGBEengineer进行碱基编辑[图3(d)]。此外,即使胞嘧啶位于5~8位窗口中,只有具有TC环境中的C才能被编辑[图3(d)]。

此外,用耻垢分枝杆菌UNG(mUNG)替代了CGBEengineer中的eUNG,以促进耻垢分枝杆菌中的C到G的编辑(见附录A中的图S4)。构建了mUNG或eUNG分别融合在CBE的N端或C端的4种蛋白,并测试了它们在耻垢分枝杆菌中的编辑效果。研究发现,将mUNG或eUNG融合到CBE的C端时,两种碱基编辑器的编辑效率差别不大,而将mUNG或eUNG融合到CBE的N端时,则都不能产生高效的C到G的编辑(见附录A中的图S4)。考虑到采用mUNG或eUNG对C到G的编辑影响不大,本研究维持原有的CGBEengineer进行后续表征。

《3.4 使用CTBE对耻垢分枝杆菌中的基因进行失活》

3.4 使用CTBE对耻垢分枝杆菌中的基因进行失活

CRISPR C到T碱基编辑器可以将CAA、CGA、CAG和TGG密码子转换为终止密码子,因此,这些编辑器是很有前途的基因失活工具[4950]。为了检测CTBEengineer对基因进行失活的能力,设计了三个靶向亮氨酸生物合成的必需基因leuBleuC的spacer。为了评价CTBEengineer的编辑效率,提取了平板上所有菌落的基因组DNA,并对靶向区域进行扩增和测序。在三个spacer中都观察到了有效的编辑[见图3(f)和附录A中的图S5],之后,对分离出的突变体菌株进行了表型分析。在leuBleuC中产生一个过早的终止密码子使细菌在缺少亮氨酸的情况下无法生长,证实了亮氨酸生物合成通路的失活[图3(f)]。此外,利用CTBEengineerctpE中生成了一个终止密码子,实现了对ctpE的失活。与之前的研究[51]一致,在EGTA存在的情况下,通过引入终止密码子使ctpE(钙转运腺苷5′-三磷酸酶)失活,增加了细菌的聚集(见附录A中的图S6)。总之,这些结果证实了CTBEengineer是一个强大而可靠的工具,可以在耻垢分枝杆菌中实现基因失活。

《3.5 耻垢分枝杆菌中的多位点编辑》

3.5 耻垢分枝杆菌中的多位点编辑

对生长缓慢的病原体进行多个基因的编辑非常耗时,而同时对多个基因进行编辑可以极大地加快基因组编辑的速度。将两个sgRNA表达盒组装到单个CTBEengineer质粒中,以测试CTBEengineer在耻垢分枝杆菌mc2155株中的多基因编辑能力[见附录A中的图S7(a)]。如附录A中的图S7(b)所示,在随机选取的8个菌落中,有6个菌落中的sigFMs6753是同时被编辑的。此外,将三个sgRNA组装到CTBEengineer质粒中,同时靶向三个不同的基因组位点(cysSsigFMs6753)。从平板上随机挑选了8个菌落,其中有7个菌落成功地编辑了三个位点[图4(a)、(b)]。同样,将两个或三个sgRNA表达盒组装到单个CGBEengineer质粒中,以测试CGBEengineer在耻垢分枝杆菌mc2155株中的多基因编辑能力[见附录A中的图S8(a)和图4(c)]。将两个sgRNA组装到CGBEengineer质粒中,如附录A中的图S8(b)所示,从平板上随机挑选了8个菌落,其中有6个菌落成功地编辑了两个位点。将三个sgRNA组装到CGBEengineer质粒中,如图4(d)所示,从平板上随机挑选了8个菌落,其中有6个菌落成功地编辑了三个位点。综上所述,这些结果表明CTBEengineer和CGBEengineer可以在耻垢分枝杆菌中进行多基因编辑。

《图4》

图4 耻垢分枝杆菌的多基因编辑。(a)CTBEengineer介导的多基因编辑的单质粒系统示意图。(b)CTBEengineer介导的多基因编辑实验的编辑结果。方框和反义方框分别表示目标序列和PAM。被编辑过的碱基显示为红色,并用黄色背景突出显示。(c)CGBEengineer介导的多基因编辑的单质粒系统示意图。(d)CGBEengineer介导的多基因编辑实验的编辑结果。方框和反义方框分别表示目标序列和PAM。被编辑过的碱基显示为红色,并用黄色背景突出显示。

《3.6 CTBE的全基因组脱靶评价》

3.6 CTBE的全基因组脱靶评价

为了评估CTBEengineer系统的全基因组脱靶情况,随机选择了两个编辑过的耻垢分枝杆菌菌落进行全基因组测序。未检测到在含有近PAM端1~8核苷酸相同序列的潜在的脱靶位点处的编辑(见附录A中的表S7)。这些结果表明了CTBEengineer系统具有较高的编辑保真度,这与之前发现St1Cas9是一种对spacer序列的突变高度敏感的高保真酶的结果一致[43]。

《3.7 结核分枝杆菌的基因编辑》

3.7 结核分枝杆菌的基因编辑

鉴于CTBEengineer在耻垢分枝杆菌中能够进行碱基编辑,因此对该系统能否在结核分枝杆菌中进行碱基编辑进行了检验。将4个靶向内源性位点的spacer分别克隆到CTBEengineer系统中,并将得到的质粒分别电转到结核分枝杆菌H37Rv感受态细胞中。为了评价CTBEengineer的编辑效率,提取了平板上所有菌落的基因组DNA,并对靶向区域进行扩增和测序。在所有4个测试位点都观察到了显著的C到T编辑,编辑效率为12%~95% [图5(a)]。此外,利用在katG中生成终止密码子的方法对katG进行失活[图5(b)]。表型分析进一步证实了katG的失活,因为katG突变株对异烟肼(16 μg∙mL-1)的抗性高于野生型菌株[52] [图5(b)]。由于生成的终止密码子在开放阅读框(ORF)中的相对位置会显著影响基因失活效率,因此,利用CRISPR-CBEI系统计算了分枝杆菌中CTBEengineer能够引入过早终止的终止密码子的分布[50]。如图5(c)所示,在被分析的三种分枝杆菌(分别为结核分枝杆菌、耻垢分枝杆菌和海洋分枝杆菌)中,超过75%、60%和40%的ORF可能被CTBEengineer靶向,并在ORF的前75%、50%和25%区域内引入至少一个终止密码子。这表明CTBEengineer可以在分枝杆菌中失活许多基因。

《图5》

图5 使用CTBEengineer对结核分枝杆菌进行碱基编辑。(a)条形图显示了CTBEengineer在不同位点对结核分枝杆菌的编辑效率。底部的数字表示碱基在spacer中的位置,其中1代表离PAM最远的碱基。箭头表示该位置的C有一部分被编辑成T。(b)通过生成过早的终止密码子的方法对katG进行失活。katG的失活使结核分枝杆菌对异烟肼产生耐药性。方框和反义方框分别表示目标序列和PAM。(c)CTBEengineer在分枝杆菌ORF中生成过早的终止密码子时可以失活的基因百分数。

《4、 结论》

4、 结论

遗传操作对于结核分枝杆菌生物学研究和药物靶点的探索具有重要意义。在结核分枝杆菌中进行无痕、精确且无标记的基因编辑方法需要依赖同源重组修复,且需要耗费数月到一年的时间。CRISPR辅助的同源重组修复方法已经被用于在多种细菌中进行快速和精确的基因组编辑[13,15,17,34]。然而,这一方法并不适用于结核分枝杆菌,可能是因为结核分枝杆菌中缺乏与CRISPR兼容的同源重组修复系统。利用催化失活的St1Cas9、SpCas9或新杀弗朗西斯菌Cas12a(FnCas12a)的CRISPRi系统已经被开发用于分枝杆菌的基因沉默。然而,这些系统只能实现部分基因的敲除,并且会产生极性效应,使Cas蛋白结合位点下游的基因也被沉默[2122]。

为了解决分枝杆菌基因编辑中的问题,本文开发了高效的PAM扩展型St1Cas9从C到T和从C到G的碱基编辑器,用于分枝杆菌的碱基编辑。这些系统可以通过一个转化步骤实现精确的单碱基替换,从而大大减少遗传操作所需的时间和劳动。此外,可被CRISPRi系统极性效应沉默的Cas蛋白结合位点下游基因的表达[2122]不会受到碱基编辑系统的影响。此外,碱基编辑系统可以进行高效的多基因编辑,因为在生长缓慢的病原体中对多个基因逐步进行编辑是非常耗时的。由于靶向基因组位点只需要20个核苷酸的spacer,除用于单基因编辑外,该系统还可以进一步改造成高通量基因敲除筛选方法。这种方法将有助于系统地发现新的药物靶点,促进分枝杆菌治疗新方法的开发。