# 什么是 CRISPR-Cas
系统
CRISPR-Cas
系统是原核生物的一种天然免疫系统。某些细菌在遭到病毒入侵后,能够把病毒基因的一小段存储到自身的 DNA
里一个称为 CRISPR
的存储空间。当再次遇到病毒入侵时,细菌能够根据存写的片段识别病毒,将病毒的 DNA
切断而使之失效。
CRISPR-Cas
系统包含 CRISPR
基因座和 Cas
基因( CRISPR
关联基因)两部分。
-
CRISPR
是原核生物基因组内的一段重复序列。CRISPR
全称Clustered Regularly Interspersed Short Palindromic Repeats
(成簇的规律性间隔的短回文重复序列)。分布在40%
的已测序细菌和90%
的已测序古细菌当中。 (注:生活在深海的火山口、陆地的热泉以及盐碱湖等极端环境中,有一些独特结构的细菌,称为古细菌)CRISPR
基因序列主要由前导序列(leader)
、重复序列(repeat
)和间隔序列(spacer
)构成。
-
①前导序列:富含
AT
碱基,位于CRISPR
基因上游,被认为是CRISPR
序列的启动子。 -
②重复序列:长度约
20–50 bp
碱基且包含5–7 bp
回文序列,转录产物可以形成发卡结构,稳定RNA
的整体二级结构。 -
③间隔序列:是被细菌俘获的外源
DNA
序列。这就相当于细菌免疫系统的 “黑名单”,当这些外源遗传物质再次入侵时,CRISPR/Cas
系统就会予以精确打击。
-
Cas
基因位于CRISPR
基因附近或分散于基因组其他地方,该基因编码的蛋白均可与CRISPR
序列区域共同发生作用。因此,该基因被命名为CRISPR
关联基因(CRISPR associated,Cas
)。Cas
基因编码的Cas
蛋白在防御过程中至关重要,目前已经发现了Cas1-Cas10
等多种类型的Cas
基因。
依据 Cas
蛋白在细菌免疫防御过程中参与的角色,目前将 CRISPR-Cas
系统分为两大类。
第一大类:它们切割外源核酸的效应因子为多个 Cas
蛋白形成的复合物,包括 Ⅰ
型、 Ⅲ
型和 Ⅳ
型。
第二大类:它们的作用因子是比较单一的 Cas
蛋白,比如 Ⅱ
型的 Cas9
蛋白和 Ⅴ
型的 Cpf
蛋白。
目前,被最为广泛应用的 CRISPR
系统是 II
型 CRISPR-Cas
系统,也就是 CRISPR-Cas9
系统。
# CRISPR-Cas9
的作用原理
对于 CRISPR-Cas9
的作用机理可以分为三个阶段来理解。
# 1、第一阶段: CRISPR
的高度可变的间隔区的获得(俘获外源 DNA
,登记 “黑名单”)
CRISPR
的高度可变的间隔区获得,其实就是指外来入侵的噬菌体或是质粒 DNA
的一小段 DNA
序列被整合到宿主菌的基因组,整合的位置位于 CRRSPR
的 5’ 端的两个重复序列之间。因此, CRISPR
基因座中的间隔序列从 5’ 到 3’ 的排列也记录了外源遗传物质入侵的时间顺序。
新间隔序列的获得可能分为三步:
-
第 1 步:
Cas1
和Cas2
编码的蛋白将扫描入侵的DNA
,并识别出PAM
区域,然后将临近PAM
的DNA
序列作为候选的原型间隔序列。- ①
PAM
类似身份证,原型间隔序列类似身份证号码。 - ②
PAM
通常由NGG
三个碱基构成(N
为任意碱基)。 - ③
Cas1
和Cas2
蛋白是负责新间隔序列获得的核心蛋白.另外研究发现TypeⅡ CRISRP/ Cas
系统中Csn2
蛋白对于新的间隔序列的获得也是必需的。
- ①
-
第 2 步:
Cas1/2
蛋白复合物将原间隔序列从外源DNA
中剪切下来,并在其他酶的协助下将原间隔序列插入临近CRISPR
序列前导区的下游。 -
第 3 步:
DNA
会进行修复,将打开的双链缺口闭合。这样一来,一段新的间隔序列就被添加到了基因组的CRISPR
序列之中。
# 2、第二阶段: CRIPSR
基因座的表达(包括转录和转录后的成熟加工)
CRISPR
序列在前导区的调控下转录产生 pre-crRNA
( crRNA
的前体),同时与 pre-crRNA
序列互补的 tracrRNA
(反式激活 crRNA
)也被转录出来。 pre-crRNA
通过碱基互补配对与 tracrRNA
形成双链 RNA
并与 Cas9
编码的蛋白组装成一个复合体。它将根据入侵者的类型,选取对应的 “身份证号码”(间隔序列 RNA
),并在核糖核酸酶 Ⅲ( RNaseⅢ
)的协助下对这段 “身份证” 进行剪切,最终形成一段短小的 crRNA
(包含单一种类的间隔序列 RNA
以及部分重复序列区)。
crRNA,Cas9
以及 tracrRNA
组成最终的复合物,为下一步剪切做好准备。
# 3、第三阶段: CRISPR/Cas
系统活性的发挥(靶向干扰)
crRNA,Cas9
以及 tracrRNA
组成最终的复合物就像是一枚制导导弹,可以对入侵者的 DNA 进行精确的打击。这个复合物将扫描整个外源 DNA
序列,并识别出与 crRNA
互补的原间隔序列。这时,复合物将定位到 PAM/
原间隔序列的区域, DNA
双链将被解开,形成 R-Loop。crRNA
将与互补链杂交,而另一条链则保持游离状态。
随后, Cas9
蛋白精确的平端切割位点位于 PAM
上游 3
个核苷酸位置,形成平末端产物。 Cas9
蛋白的 HNH
结构域负责切割与 crRNA
互补配对的那一条 DNA 链,而 RuvC
结构域负责切割另外一条非互补 DNA
链。最终在 Cas9
的作用下 DNA
双链断裂 (DSB)
,外源 DNA
的表达被沉默,入侵者被一举歼灭。
# CRISPR-Cas9
基因编辑技术及应用
tracrRNA-crRNA
在被融合为单链向导 RNA(sgRNA)
时也可以发挥指导 Cas9
的作用。
CRISPR-Cas9
基因编辑技术就是通过人工设计的 sgRNA(guide RNA)
来识别目的基因组序列,并引导 Cas9
蛋白酶进行有效切割 DNA
双链,形成双链断裂,损伤后修复会造成基因敲除或敲入等,最终达到对基因组 DNA
进行修饰的目的。
CRISPR-Cas9
的广泛应用
# 1. 基因敲除 (Knock-out)
Cas9
可以对靶基因组进行剪切,形成 DNA
的双链断裂。在通常情况下,细胞会采用高效的非同源末端连接方式( NHEJ
)对断裂的 DNA
进行修复。但是,在修复过程中通常会发生碱基插入或缺失的错配现象,造成移码突变,(移码突变:是指 DNA
分子由于某位点碱基的缺失或插入,引起阅读框架变化,造成下游的一系列密码改变,使原来编码某种肽链的基因变成编码另一种完全不同的肽链序列。)使靶标基因失去功能,从而实现基因敲除。为了提高 CRISPR
系统的特异性,可将 Cas9
的一个结构域进行突变,形成只能对 DNA
单链进行切割造成 DNA
缺口的 Cas9 nickase
核酸酶。因此想要形成双链断裂的效果可以设计两条 sgRNA
序列,分别靶向 DNA
互补的两条链,这样两条 sgRNA
特异性的结合靶标序列,即可形成 DNA
断裂,并在修复过程中通过移码突变实现基因敲除
# 2. 基因敲入( Knock-in
)
当 DNA
双链断裂后,如果有 DNA
修复模板进入到细胞中,基因组断裂部分会依据修复模板进行同源重组修复( HDR
),从而实现基因敲入。修复模板由需要导入的目标基因和靶序列上下游的同源性序列(同源臂)组成,同源臂的长度和位置由编辑序列的大小决定。 DNA
修复模板可以是线性 / 双链脱氧核苷酸链,也可以是双链 DNA
质粒。 HDR
修复模式在细胞中发生率较低,通常小于 10%
。为了增加基因敲入的成功率,目前有很多科学家致力于提高 HDR
效率,将编辑的细胞同步至 HDR
最活跃的细胞分裂时期,促进修复方式以 HDR
进行;或者利用化学方法抑制基因进行 NHEJ
,提高 HDR
的效率
# 3. 基因抑制、基因激活
Cas9
的特点是能够自主结合和切割目的基因,通过点突变的方式使 Cas9
的两个结构域 RuvC-
和 HNH-
失去活性,形成的 dCas9
只能在 sgRNA
的介导下结合靶基因,而不具备剪切 DNA
的功能。因此,将 dCas9
结合到基因的转录起始位点,可以阻断转录的开始,从而抑制基因表达;将 dCas9
结合到基因的启动子区域也可以结合转录抑制 / 活化物,使下游靶基因转录受到抑制或激活。因此 dCas9
与 Cas9、Cas9 nickase
的不同之处在于, dCas9
造成的激活或者抑制是可逆的,并不会对基因组 DNA
造成永久性的改变。
# 4. 多重编辑 (Multiplex Editing)
将多个 sgRNA
质粒转入到细胞中,可同时对多个基因进行编辑,具有基因组功能筛选作用。多重编辑的应用包括:使用双 Cas9nickases
提高基因敲除的准确率、大范围的基因组缺失及同时编辑不同的基因。通常情况下,一个质粒上可以构建 2~7
个不同的 sgRNA
进行多重 CRISPR
基因编辑。
# 5. 功能基因组筛选
利用 CRISPR-Cas9
进行基因编辑可以产生大量的基因突变细胞,因此利用这些突变细胞可以确认表型的变化是否是由基因或者遗传因素导致的。基因组筛选的传统方法是 shRNA
技术,但是 shRNA
有其局限性:具有很高的脱靶效应以及无法抑制全部基因而形成假阴性的结果。 CRISRP-Cas9
系统的基因组筛选功能具有高特异性和不可逆性的优势,在基因组筛选中得到了广泛的应用。目前 CRISPR
的基因组筛选功能应用于筛选对表型有调节作用的相关基因,如对化疗药物或者毒素产生抑制的基因、影响肿瘤迁移的基因以及构建病毒筛选文库对潜在基因进行大范围筛选等。