# 什么是 CRISPR-Cas 系统
CRISPR-Cas 系统是原核生物的一种天然免疫系统。某些细菌在遭到病毒入侵后,能够把病毒基因的一小段存储到自身的 DNA 里一个称为 CRISPR 的存储空间。当再次遇到病毒入侵时,细菌能够根据存写的片段识别病毒,将病毒的 DNA 切断而使之失效。
CRISPR-Cas 系统包含 CRISPR 基因座和 Cas 基因( CRISPR 关联基因)两部分。
-
CRISPR是原核生物基因组内的一段重复序列。CRISPR全称Clustered Regularly Interspersed Short Palindromic Repeats(成簇的规律性间隔的短回文重复序列)。分布在40%的已测序细菌和90%的已测序古细菌当中。 (注:生活在深海的火山口、陆地的热泉以及盐碱湖等极端环境中,有一些独特结构的细菌,称为古细菌)CRISPR基因序列主要由前导序列(leader)、重复序列(repeat)和间隔序列(spacer)构成。
-
①前导序列:富含
AT碱基,位于CRISPR基因上游,被认为是CRISPR序列的启动子。 -
②重复序列:长度约
20–50 bp碱基且包含5–7 bp回文序列,转录产物可以形成发卡结构,稳定RNA的整体二级结构。 -
③间隔序列:是被细菌俘获的外源
DNA序列。这就相当于细菌免疫系统的 “黑名单”,当这些外源遗传物质再次入侵时,CRISPR/Cas系统就会予以精确打击。
-
Cas基因位于CRISPR基因附近或分散于基因组其他地方,该基因编码的蛋白均可与CRISPR序列区域共同发生作用。因此,该基因被命名为CRISPR关联基因(CRISPR associated,Cas)。Cas基因编码的Cas蛋白在防御过程中至关重要,目前已经发现了Cas1-Cas10等多种类型的Cas基因。
依据 Cas 蛋白在细菌免疫防御过程中参与的角色,目前将 CRISPR-Cas 系统分为两大类。
第一大类:它们切割外源核酸的效应因子为多个 Cas 蛋白形成的复合物,包括 Ⅰ 型、 Ⅲ 型和 Ⅳ 型。
第二大类:它们的作用因子是比较单一的 Cas 蛋白,比如 Ⅱ 型的 Cas9 蛋白和 Ⅴ 型的 Cpf 蛋白。
目前,被最为广泛应用的 CRISPR 系统是 II 型 CRISPR-Cas 系统,也就是 CRISPR-Cas9 系统。
# CRISPR-Cas9 的作用原理
对于 CRISPR-Cas9 的作用机理可以分为三个阶段来理解。
# 1、第一阶段: CRISPR 的高度可变的间隔区的获得(俘获外源 DNA ,登记 “黑名单”)
CRISPR 的高度可变的间隔区获得,其实就是指外来入侵的噬菌体或是质粒 DNA 的一小段 DNA 序列被整合到宿主菌的基因组,整合的位置位于 CRRSPR 的 5’ 端的两个重复序列之间。因此, CRISPR 基因座中的间隔序列从 5’ 到 3’ 的排列也记录了外源遗传物质入侵的时间顺序。
新间隔序列的获得可能分为三步:
-
第 1 步:
Cas1和Cas2编码的蛋白将扫描入侵的DNA,并识别出PAM区域,然后将临近PAM的DNA序列作为候选的原型间隔序列。- ①
PAM类似身份证,原型间隔序列类似身份证号码。 - ②
PAM通常由NGG三个碱基构成(N为任意碱基)。 - ③
Cas1和Cas2蛋白是负责新间隔序列获得的核心蛋白.另外研究发现TypeⅡ CRISRP/ Cas系统中Csn2蛋白对于新的间隔序列的获得也是必需的。
- ①
-
第 2 步:
Cas1/2蛋白复合物将原间隔序列从外源DNA中剪切下来,并在其他酶的协助下将原间隔序列插入临近CRISPR序列前导区的下游。 -
第 3 步:
DNA会进行修复,将打开的双链缺口闭合。这样一来,一段新的间隔序列就被添加到了基因组的CRISPR序列之中。
# 2、第二阶段: CRIPSR 基因座的表达(包括转录和转录后的成熟加工)
CRISPR 序列在前导区的调控下转录产生 pre-crRNA ( crRNA 的前体),同时与 pre-crRNA 序列互补的 tracrRNA (反式激活 crRNA )也被转录出来。 pre-crRNA 通过碱基互补配对与 tracrRNA 形成双链 RNA 并与 Cas9 编码的蛋白组装成一个复合体。它将根据入侵者的类型,选取对应的 “身份证号码”(间隔序列 RNA ),并在核糖核酸酶 Ⅲ( RNaseⅢ )的协助下对这段 “身份证” 进行剪切,最终形成一段短小的 crRNA (包含单一种类的间隔序列 RNA 以及部分重复序列区)。
crRNA,Cas9 以及 tracrRNA 组成最终的复合物,为下一步剪切做好准备。
# 3、第三阶段: CRISPR/Cas 系统活性的发挥(靶向干扰)
crRNA,Cas9 以及 tracrRNA 组成最终的复合物就像是一枚制导导弹,可以对入侵者的 DNA 进行精确的打击。这个复合物将扫描整个外源 DNA 序列,并识别出与 crRNA 互补的原间隔序列。这时,复合物将定位到 PAM/ 原间隔序列的区域, DNA 双链将被解开,形成 R-Loop。crRNA 将与互补链杂交,而另一条链则保持游离状态。
随后, Cas9 蛋白精确的平端切割位点位于 PAM 上游 3 个核苷酸位置,形成平末端产物。 Cas9 蛋白的 HNH 结构域负责切割与 crRNA 互补配对的那一条 DNA 链,而 RuvC 结构域负责切割另外一条非互补 DNA 链。最终在 Cas9 的作用下 DNA 双链断裂 (DSB) ,外源 DNA 的表达被沉默,入侵者被一举歼灭。
# CRISPR-Cas9 基因编辑技术及应用
tracrRNA-crRNA 在被融合为单链向导 RNA(sgRNA) 时也可以发挥指导 Cas9 的作用。
CRISPR-Cas9 基因编辑技术就是通过人工设计的 sgRNA(guide RNA) 来识别目的基因组序列,并引导 Cas9 蛋白酶进行有效切割 DNA 双链,形成双链断裂,损伤后修复会造成基因敲除或敲入等,最终达到对基因组 DNA 进行修饰的目的。
CRISPR-Cas9 的广泛应用
# 1. 基因敲除 (Knock-out)
Cas9 可以对靶基因组进行剪切,形成 DNA 的双链断裂。在通常情况下,细胞会采用高效的非同源末端连接方式( NHEJ )对断裂的 DNA 进行修复。但是,在修复过程中通常会发生碱基插入或缺失的错配现象,造成移码突变,(移码突变:是指 DNA 分子由于某位点碱基的缺失或插入,引起阅读框架变化,造成下游的一系列密码改变,使原来编码某种肽链的基因变成编码另一种完全不同的肽链序列。)使靶标基因失去功能,从而实现基因敲除。为了提高 CRISPR 系统的特异性,可将 Cas9 的一个结构域进行突变,形成只能对 DNA 单链进行切割造成 DNA 缺口的 Cas9 nickase 核酸酶。因此想要形成双链断裂的效果可以设计两条 sgRNA 序列,分别靶向 DNA 互补的两条链,这样两条 sgRNA 特异性的结合靶标序列,即可形成 DNA 断裂,并在修复过程中通过移码突变实现基因敲除
# 2. 基因敲入( Knock-in )
当 DNA 双链断裂后,如果有 DNA 修复模板进入到细胞中,基因组断裂部分会依据修复模板进行同源重组修复( HDR ),从而实现基因敲入。修复模板由需要导入的目标基因和靶序列上下游的同源性序列(同源臂)组成,同源臂的长度和位置由编辑序列的大小决定。 DNA 修复模板可以是线性 / 双链脱氧核苷酸链,也可以是双链 DNA 质粒。 HDR 修复模式在细胞中发生率较低,通常小于 10% 。为了增加基因敲入的成功率,目前有很多科学家致力于提高 HDR 效率,将编辑的细胞同步至 HDR 最活跃的细胞分裂时期,促进修复方式以 HDR 进行;或者利用化学方法抑制基因进行 NHEJ ,提高 HDR 的效率
# 3. 基因抑制、基因激活
Cas9 的特点是能够自主结合和切割目的基因,通过点突变的方式使 Cas9 的两个结构域 RuvC- 和 HNH- 失去活性,形成的 dCas9 只能在 sgRNA 的介导下结合靶基因,而不具备剪切 DNA 的功能。因此,将 dCas9 结合到基因的转录起始位点,可以阻断转录的开始,从而抑制基因表达;将 dCas9 结合到基因的启动子区域也可以结合转录抑制 / 活化物,使下游靶基因转录受到抑制或激活。因此 dCas9 与 Cas9、Cas9 nickase 的不同之处在于, dCas9 造成的激活或者抑制是可逆的,并不会对基因组 DNA 造成永久性的改变。
# 4. 多重编辑 (Multiplex Editing)
将多个 sgRNA 质粒转入到细胞中,可同时对多个基因进行编辑,具有基因组功能筛选作用。多重编辑的应用包括:使用双 Cas9nickases 提高基因敲除的准确率、大范围的基因组缺失及同时编辑不同的基因。通常情况下,一个质粒上可以构建 2~7 个不同的 sgRNA 进行多重 CRISPR 基因编辑。
# 5. 功能基因组筛选
利用 CRISPR-Cas9 进行基因编辑可以产生大量的基因突变细胞,因此利用这些突变细胞可以确认表型的变化是否是由基因或者遗传因素导致的。基因组筛选的传统方法是 shRNA 技术,但是 shRNA 有其局限性:具有很高的脱靶效应以及无法抑制全部基因而形成假阴性的结果。 CRISRP-Cas9 系统的基因组筛选功能具有高特异性和不可逆性的优势,在基因组筛选中得到了广泛的应用。目前 CRISPR 的基因组筛选功能应用于筛选对表型有调节作用的相关基因,如对化疗药物或者毒素产生抑制的基因、影响肿瘤迁移的基因以及构建病毒筛选文库对潜在基因进行大范围筛选等。