实验材料

质粒

试剂、试剂盒

DNase 缓冲液EDTA 溶液TBE 缓冲液丁醇转化盐储液氨芐储液悬浮缓冲液硼酸缓冲液

仪器、耗材

水浴锅分光光度仪分光荧光计

实验步骤

本章主要介绍提高蛋白质热稳定性的常规方法,而不需要在高温下筛选酶活性。介绍完 β 内酰胺酶模型系统(见 16.3.1 ),我们描述末端截切(见 16.3.2 和 16.3.3 ) 的设计方案,它们对酶活的影响(见 16.3.4 )。突变库由酶的定向进化和错误向 PCR 产生(见 16.3.5),然后在体内应用不同的筛选压力进行筛选(见 16.3.6)。在本节的最后一部分讨论截切突变体的再延长(见 16.3.7)、表达策略和纯化方案、酶学方法 ( 见 16.3.9 ) 以及稳定性检测(见 16.3.10)。

3.1 β-内酰胺酶模型系统

为了说明截切- 优化-再延长可以用来提高蛋白质的热稳定性,内酰胺酶被选作模型系统(图 16.1A )。作为一个临床发病机制相关的研究因子和重要的抗体,它所属的家族已被广泛研究,多个晶体结构已解析。许多对该酶的突变已被用于更好地研究和解释结构-功能相关性以及理性设计截切片段。此外,稳定的 β-内酰胺酶还被用于癌症治疗的潜在药物的活性研究,以便得到潜在的药物前体化合物 [ 27,28 ] 。

β-内酰胺酶的 A 家族(EC 3.5.2.6 ) 是细菌胞质酶,其氨基酸序列多样化,稳定性不同,但其三维结构很相似。尽管 β-内酰胺酶的 A 家族的肽主链在核心区能很好地重叠在一起,但在两个末端并没有很好的重叠性。末端结构的不同也与氨基酸长度和氨基酸组成相符合,让这类酶适合于研究序列同源和功能的相关重要性。

3.2 设计末端截切

缺失突变体的正确设计很重要:如果末端截切的过多,由于结构稳定性不够和错误折叠,其得到的截切突变体将没有功能;同样,如果截切的不够多,很有可能得不到期望的表型,选择压力将无法选择出稳定的结构。

如果目标蛋白的结构已被解析,可用 Protein  Data  Bank (PDB;http : //www.pdb.org/),SWISSPROT ( http :  //www.   expasy.   org/sprot/和  http :  //www.ebi. ac.uk/swissprot) 以及  SCOP  ( http :  //scop. mrc-lmb.   cam . ac . uk/ scop/ ) 等数据库以及结构分析工具,如分子模型程序 WHATIF (http :  //swift  cmbi.
kuru  nl/WIWWWI) 和 CE 运算法(http :  //cl.   sdsc .   edu /ce . html) ,来进行结构比较和分析。另外,接触图可用作识别可能的非重要和重要的相互作用,这些在设计过程也很重要。如果没有高分辨结构,可用其他的数据 库(如 HSSP) 和 SWISS MODEL 同源模型服务器(http :  //swissmodel.   expasy.   org) , 或者用一个或两个氨
基酸逐切来决定最大截切数。

在该研究中,根据以前的 β-内酰胺酶的突变体研究 [29] 而设计 4 个截切突变体,对 β-内酰胺酶的 A 家族进行结构同源序列比对,用 CE 运算法 [ 30 ] 和 SWIS& PDB 浏览器 [31] (http :  //ww w.   expasy.   org/spdbv) ( 图 16.1B 和图 16.1C) 来分析结构。截切的突变体试图在生理温度下引入结构干扰而不会使蛋白质完全没有功能。N 端前 3 个氨基酸( His、Pro 和 Glu) 有很高的温度因子(高达 23.8A,平均 13.1A )和溶剂可接触性(PDB 号1btl ),当去掉前 3 个氨基酸得到的突变体 N△3 对蛋白质稳定性的影响比较小。N△5 突变体去掉临近的苏氨酸和亮氨酸,其中苏氨酸被完全掩盖并与 C 端的 Ser285 氨基酸形成氢键。在 C 端,只有 1 个和 3 个氨基酸被去掉 (突变体 C△1 和 C△3 ),因为以前的研究表明末端酪氨酸是关键的氨基酸 [32] 。

3. 载体质粒的设计

载体质粒被设计为当野生型 β-内酰胺酶或截切的突变体与用于细胞间质定位的 N 端 pelB 信号序列融合表达。一 个短的天冬氨酸-甘氨酸的链接被引入用来确保 N 端不同的突变体同等的处理效率。最后,C 端连接 His-tag 可用于固定金属离子亲和柱来纯化,甚至能够纯化非野生型的 β-内酰胺酶变体(图 16.2A)。


载体构建步骤如下:

( 1 ) TEM-1β-内酰胺酶截切突变体 NA3、N△5 和 C△1 及 C△3 是由 pUC 衍生的 TEM-1 基因扩增而来,分别用其正向和反向引物。正向引物含 5' Sfi I 酶切位点,还包含 pelB 信号肽链的 C 端编码序列和 TEM-1 截切突变体的 N 端修饰(截切)序列。在基因的 3' 端,包含反向序列编码改造的 TEM-1 的 C 端序列、1 个短的序列(2 个甘氨酸残基)、5 个 His-tag、2 个终止密码子和 Hind lll 酶切位点。

( 2 ) 其 PCR 产物由 Sfi I/Hind III 双酶切、纯化,然后克隆到 pKMENGRbla (由 K.M.M. 提供)载体中,pKMENGRbla 是由表达载体 pKA400 [ 26 ] 改造而来,含有 1 个氯霉素抗性基因。

得到的质粒(pKJE_Bla—NA/CA 系列)在 lac 操纵子下表达了各种 TEM-1 突变体基因。尽管质粒上的 lacI 有组成型表达,强的 T7g10 Shine-Dalgarno 序列 [ 35 ] 有很高的表达水平,因此所有选择步骤在极端条件下进行,并未过表达。

3.4 末端截切对酶活性的影响

为了检测末端截切对酶活性的影响,在氨苄抗性递增的固体培养基和液体培养基中测其生长速度。通常,在固体板上的筛选比液体状态下更为苛刻。通过本底表达及 IPTG 诱导表达以及在不同温度下的诱导来观察体系的不同。

( 1 ) 如果有需要,用标准方法转化 BL21 细胞涂在 LB/Cm 板上。

( 2 ) 从甘油菌或者转化的过夜(16 h) 培养的 LB/Cm 板上 [ 步骤(1 ) ] 挑取单克隆。

( 3 ) 将过夜培养的菌,在新培养基中稀释至 OD600 为 0.1,并将其培养至 OD600 为 1 ( 见注 1)。

( 4 ) 将预培养的菌液 [ 步骤(3 ) ] 涂在含 IPTG 与不含 IPTG 的不同浓度的氨苄抗性板上。被涂的菌量可估量为 2.5X108 个细胞/ml,1 个 OD600

( 5 ) 在液体 LB/Cm 培养基中加入步骤(3 ) 的菌液,在含 IPTG 与不含 IPTG 的不同浓度的氨苄培养基中培养。

( 6 ) 生长速率 [ 步骤(4 ) 和(5 ) ] 可以在不同温度下重复。

在不诱导情况下,于固体板上 37°C 培养,当氨苄抗性浓度从 0 μg/ml 增加到 50 μg/ml 时,所有截切突变体的克隆数急剧减少(图 16.2B) 。在连续培养 40 h 后突变体 N△5 和 C△3 没有长出克隆,说明了末端氨基酸的重要性。当 25°C 诱导时,N△5 能够在高达 50 μg/ml 的氨苄固体培养基中生长,在 37°C 液体培养基中在合适的供氧情况下仍能生长。这说明两个截切突变体都能干扰蛋白质结构,但同时可以折叠成有活性的结构。N△5 突变体比 C△3 对抗生素的容忍性更小,因此更适合于下一步的优化。

3.5 DNA 混编和随机突变

逆转由末端截切或删除突变造成的结构干扰的关键优化步骤是在遗传水平上建立高度可变的突变库。随机突变与 DNA 重组的结合能够满足这样的突变需求。

DNA 混编 [ 15,16 ] 是在试管里进行 DNA 重组的广泛应用的方法。由 DNA 混编方法将不同源的基因混杂在一起是定向进化中的关键步骤,其主要特点简述如下:在全基因上进行随机点突变后,主要是由易错 PCR ( 见 16.3.7 ) 引入突变得到的突变库可用来 DNA 片段化,从而得到小的、略微不同的、可相互交换的、长度为 50~200 个碱基对的 DNA 片段。将一个或多个核苷酸不同的同源序列交迭并用 PCR 重新扩增成长片
段,起初用低温退火来确保最小的片段也能够进行 PCR。随着循环次数的增加,将退火温度逐步提髙来选择长的交迭片段。最后,用基因两侧的引物合成全长的基因,并引入合适的酶切位点进行下一步的克隆。

以下内容介绍用易错 PCR 和 DNA 混编来创建有足够复杂度、多样化的突变库。值得注意的是,这里介绍的步骤只针对我们的系统,随着目标基因的长度和组成需要有所改变。需要考虑在易错 PCR 引进突变之前反应的覆盖率,第一次随机突变,第二次组合是不能用来决定混编过程中的错误率的(见注 2 )。

( 1 ) 得到足够量(5~10 μg)的目标基因,可用目标基因两端的同源序列 PCR 或者用限制性内切核酸酶基因末端剪切。如果用 PCR 方法,应该用 Taq DNA 聚合酶来合成产物。在我们的例子中,我们以 pKJE_Bla_N△5 为模板,用引物 Pr_sfi_pelB_DG_ shuffl 和 Pr_GG_his5 _ hind_shuffl 扩增截切的 β-内酰胺酶。

( 2 ) 将 4~5 μg 的目标基因用 0.2 U 的 DNase l 在 50 μl DNaSe I 的酶切体系中,于室温(25°C) 下酶切 12 min。

( 3 ) 加入 4 μl 的 EDTA 溶液终止内切酶反应,并在冰上放置。

( 4 ) 将得到的 DNA 片段在 2% 的琼脂胶上分析并回收长度为 50~150 bp 的 DNA 片段。

( 5 ) 用 Qiaex II 胶回收试剂盒回收 DNA 片段(见注 3)。

( 6 ) 在 50 μl 体系中,加入约 100~300 μg 的纯化的片段用来作引物延伸 PCR  ( 见注 4)。反应混合物包括 2.5 U DNA 聚合酶、0.4 mmol/L dNTP 2 mmol/L MgCl2。在 PCR 仪(Eppendorf) 中,PCR 反应用以下程序进行:94°C 3min;94°C 1 min  ( 变性),( 45 + 0.3 )°C 每个循环 1 min (退火),72°C 1 min (延伸)(10 个循环);最后一个循环后 72°C 5 min;94°C 1 min,(50+0.4)°C 每个循环 1 min,72°C 1 min (15 个循环);最后一个循环后 72°C 5 min;94°C 1 min,(56+0.5)°C 每个循环 1 min,72°C 1 min  (10 个循环);最后一
个循环后 72°C 5 min;94°C 1 min, ( 61 + 0.5 )°C 每个循环 2 min,72°C 2 min  (10 个循环);最后一个循环后 72°C 5 min。另外,一个简单程序,如 94°C 3 min,35 个循环:92°C 30s,(30 + 1 )°C 每个循环 1 min ,72°C 1 min + 4s/循环,最后一个循环后 72°C 5 min。

( 7 ) 扩增 1/5 体积的重叠的 PCR 反应物(不需要纯化)来扩增全长基因,并加入合适的酶切位点以便下一步克隆。这步可在易错倾向条件下进行,以便扩增突变库的多样化。除了用 Taq DNA 聚合酶延长外,扩增反应的突变率可通过 7 mmol/L MgCl2、0.5 mmol/L MnCl2 的加入而提高( 见注5)。在我们的例子中,我们用引物 Pr_sfi_
pelB_DG_shuffl 和 Pr_GG_his5_hind_shuffl,每条引物的浓度是 0.5 μmol/L。反应混合物包括 7 mmol/L MgCl2、0.5 mmol/L MnCl2、0.4 mmol/L dNTP 和 2.5U Tag。所用的程序是 94°C 3 min,25 个循环:94°C 1 min , 68°C 1 min,72°C 1 min,最后一个循环后 72°C 7 min。

( 8 ) 用 GFX  PCR  DNA 和切胶回收试剂盒来纯化 PCR 产物,用合适的酶酶切产物,克隆到表达载体中。用16.3.6 所述方法进行转化。

我们进行了 3 个循环的定向进化(S1~S3),用 DNA 混编和随机突变并结合体内筛选过程。所得到的克隆被收集,作为下一步进化的模板。在定向进化的最后一个循环中,DNA 混编后的易错 PCR 被标准的 PCR 程序取代,防止在重组的克隆中产生有害突变。

16.3.6 转化及在体内筛选突变库

( 1 ) 把质粒突变库,用丁醇沉淀。用 10~20 μl 连接混合物,加入双倍量的去离子水使体积达到 50 μl。加入 500 μl 丁醇在室温离心 2000 g,30 min。去掉上清液,在室温晾干,加入 10~20 μl 的水。

( 2 ) 将沉淀后的 DNA 加入到 100 μl 电转感受态 E.coli XL-1 蓝细胞中。1.7 kV,200Ω,25 μF。转化完后立即加入 900 μl 的 2YT 培养基和 1/100 体积的转化盐储液。

( 3 ) 将悬浮的细胞加入 10 ml 玻璃试管中,在 37°C 培养 60~70 min。

( 4 ) 通过将转化产物逐步稀释涂在 LB/Cm 板上来检测转化效率。

( 5 ) 用另一管转化的细胞涂在不同浓度的氨苄抗性 LB/Cm 板上来检测筛选压力( 见注 6)。选择在最高氨苄浓度下长出来的突变体来进行下一步实验。

( 6 ) 作为筛选,把转化的细胞涂在不同浓度的氨苄抗性 LB/Cm 板上 [ 由步骤(5 )得到的浓度 ] ( 见注 6 )。我们用的氨苄在第一到第三次筛选的浓度分别为 20 μg/ml、100 μg/ml、200 μg/ml。第一次的筛选是在液体培养基中进行,后两次筛选是在固体培养基上。

突变体 N△5 经过 3 个循环的定向进化(包括随机突变和 DNA 混编)(见 16.3.5),被损功能得以恢复。在这 3 个循环中得到 19X103 个,147X103 个和 260X103 个的克隆,分别在 20 μg/ml,100 μg/ml 和 200 μg/ml 氨苄抗性板上生长 [ 步骤(6 )],得到 3600~7000个克隆。

表 16.1 总结了所有在 3 个混编循环(S1~S3 ) 的定向进化中得到的克隆的测序结果。另外,表 16.1 还包括了每个野生型残基的相对溶剂可接触性和平均侧链原子温度因子(由 PDB 1btl )[ 37] 。其中在第二个循环后的 5 个突变体有两个突变,M182T 和 T265M  ( 根据 Ambler et  al. 命名,这两个突变在第一次循环后已经存在。



经过最后优化步骤,收集突变库,在不用 IPTG 诱导的情况下,决定最大氨苄抗性浓度,见 16.3.4 ( 图 16.3)。能长出显著数目的克隆数的抗性是 700 μg/ml,经过 40 h 的培养,克隆可在含 1000 μg/ml 的抗性上生长。相比,野生型只能在 500 μg/ml 的抗性上生长。从含 800 μg/ml 和 1000 μg/ml 的抗性板上挑取 26 个克隆,并测序。26 个克隆属于 15 个不同的突变体(表 16.1)。所有的克隆有两个共同的突变位点,M 182T 和 A224V。以
前的研究表明 M182T 突变体能够互补折叠缺陷 [39] 和稳定性缺失 [ 29,40 ]。突变体 A224V 在第三次循环中提高选择压力。这个突变体曾经被提到过,但并没有实验数据证实 [41]。

两个突变体离截切的位点有 17A 的距离,表明是由截切引起的结构干扰的独立互补。图 16.4 是对 TEM- 1β-内酰胺酶最常用的一些突变残基。通常,在单独优化的突变体中矢变在在在整个结构中分布,而不是局部聚集在一起。



3.7 全长突变体的构建

优化的 N△5-S3/6 被再延长来研究突变对被截切后的不稳定蛋白质的互补作用。根据图 16.2A,被截切的氨基酸重新被加上,从而得到全长基因——被命名为 FL-S3/6 的克隆。这个突变体定位在细胞间质,在 E.coli XL-1 Blue 中表达来检测体内功能。让人意外的是,在含氯霉素和 100 μg/ml 氨苄板上于 37°C 20 h 生长的克隆数目只有不含氨苄的对照板上的 50%。这和 N△5-S 3/6 在两个板上得到相同数目克隆成鲜明对比。为了研究蛋白质
功能和蛋白质定位,对 FL-S 3/6 和 N△5 - S3/6 的细胞粗提液做酶活反应。没有看到对发色底物头孢硝噻吩的水解反应的区别,说明酶的定位是很重要的。与这些数据相符合的是在 FL- S 3/6 的纯化过程中也能看到信号肽剪切的减少(见 16.3.8)。因此,可在细胞质内表达的 FL- S3/6-cyt 被克隆,该克隆用甲硫氨酸替代了信号肽以及Asp- Gly tag。为了保证在生理条件下正确的对比,与野生型内酰胺酶类似的基因(wt- done-cyt) 也被克隆。

展开