套式病毒主要蛋白酶(丝氨酸蛋白酶)研究进展
董建国 中国农业科学院
1 命名与活性中心
套式病毒3C样蛋白酶(3C-like protease, 3CLPro)底物结合袋中His残基为一必须的残基,决定底物酶切位点P1位为何种残基。在冠状病毒中,其主要蛋白酶称为3CLPro,该蛋白酶有一双β折叠桶结构,由12个β折叠片所组成。最早是在细胞内丝氨酸蛋白酶(糜乳蛋白酶)中发现具有这种桶状结构,故套式病毒3CLPro又被称为类糜乳蛋白酶。与冠状病毒的3CLPro不同,在动脉炎病毒中,主要蛋白酶使用丝氨酸(Ser)作为识别底物催化位点的催化残基,故动脉炎病毒中的主要蛋白酶又可称为3C样丝氨酸蛋白酶(3C-like serine protease, 3CLSP)。应用分子生物学软件进行序列同源性分析,结果显示冠状病毒3CLPro与其同属的动脉炎病毒的3CLSP之间的序列同源性较低,且仅在酶活性位点残基区域有较高同源性。
经过序列比对分析,结果显示冠状病毒3CLSP的催化系统与其他病毒的3C样蛋白酶相似,推测表明它们均使用催化3联体(His-Asp(Glu)-Cys)作为酶活性中心。根据预测的结果,通过点突变研究,结果显示这3个氨基酸残基的突变直接导致冠状病毒3CLSP活性的丧失,故这些aa是3CLSP必须的。用Ser代替IBV活性位点的Cys后进行顺式切割试验,发现突变的3CLSP仍然具有部分的酶活性,显示冠状病毒的3CLSP和动脉炎病毒的亲缘关系较高。但在MHV和Hcov病毒中,将3CLSP Cys突变为Ser后,对应的的突变体的酶活性丧失。据现在的研究充分显示,冠状病毒3CLSP中保守性的氨基酸残基His和Cys充当了亲核残基;在3C蛋白酶和3CLpro中,Ser被Cys代替作为亲核残基;在有些病毒的,细胞源蛋白酶中的催化3联体中的Asp被Glu代替。动脉炎病毒中的3CLSP催化3联体为His-Asp-Ser,冠状病毒不同于动脉炎病毒,使用的是催化2联体:由Cys与His组成。通过大量突变实验,结果显示,与其它3C蛋白酶或3CLSP催化3联体不同,冠状病毒的3CLSP的催化位点由Cys与His 2联体组成,缺少1个酸性催化残基Glu或Asp与之相对应。在非典型性肺炎病毒(SARS-CoV)、猪传染性胃肠炎病毒3CLSP的晶体结构实验中,证实了这一点。
在SARS-CoV3CLSP、TGVE的晶体结构实验中,发现有1个水分子位于动脉炎病毒第3个催化残基(Glu或Asp)的位置,这个水分子和周围的3个aa:His41、Asp186、His163形成氢键,从而可能起到与Aps类似的功能。马动脉炎病毒(EAV)3CLSP使用催化3联体His-Asp-Ser作为催化位点,通过实验证实这些氨基酸残基构成3CLSP酶活性必需的,突变会导致酶活性丧失。已有实验表明PRRSV同EAV一样,也使用催化3联体His-Asp-Ser作为活性中心,这些位点的改变可使该酶的活性丧失。
2 底物酶切位点的特异性
3CLSP的底物是病毒基因组所表达的多聚蛋白ppla和pplab。依照习惯,从切点开始N端的aa残基依次称为P1,P2,P3…,底物切点C端的aa残基依次称为P1’,P2’,,P3’…。在底物特异性方面,冠状病毒的3CLSP与其它的3CLSP相似。底物酶切位点的Pl位为Glu,Pl’位为小分子脂肪族aa残基,如Gly、Ser、Ala。当Pl’位为大分子aa残基(如Asn)时,3CLSP酶切活性则会降低。P2位一般为Leu,有时P2位也会有其它一些疏水性aa残基,如Met、Phe、Ilu、Val。而一些小分子aa残基常位于P4位,如Ala、Pro、Val、Thr、Ser。
通过aa序列的比对分析,EAV 3CLSP水解病毒自身表达的多聚蛋白的切割位点已被确定。其总共酶切位点至少有8个,已鉴定出的位于ORFla编码的ppla上的有5个,位于ORFlb编码的pp1ab上的有3个。这些酶切位点中有4个在Glu-Gly间,3个在Glu-Ser间,1个在Gln-Ser间。在所有动脉炎病毒序列中,这些酶切位点都很保守。此外,推测结果显示Lys或Ala位于Pl’的位置上。研究还发现除Pl-P1’之外,位于P2、P4上的aa残基序列也存在一定的保守性,这说明这些位点的aa残基与EAV 3CLSP对底物的特异性识别有关,有利于3CLSP识别底物。EAV中Thr-1179、His-1199aa残基相当保守,研究认为这2个aa在3CLSP识别底物时发挥关键作用,从而决定P1位aa残基Glu(Gln)的特异性。故有学者认为3CLSP的原型是EAV 3CLSP。根据序列比对,推测PRRSV 3CLSP在pp1a和pp1ab上的酶切位点有8个,其中5个位于ORFla编码的ppla上,3个位于ORFlb编码的pp1ab上。PRRSV 3CLSP在多聚蛋白的酶切位点中有6个位于Glu-Gly间,1个位于Glu-Ser间,1个位于Glu-Ala间。这些切割位点在所有PRRSV序列上都是相当保守的。研究表明用Gln代替Nsp11和Nsp12之间的切割位点Glu后,3CLSP不能识别底物,故Nsp11和Nsp12之间的Glu是3CLSP识别底物的特异性位点。除Pl-P1’之外,P2、P4位上的a(aLeu、Phe)有一定的保守性,这说明这些位点的aa残基与PRRSV 3CLSP对底物的特异性识别有关。
3. 巢状病毒主要蛋白酶的 3D 结构
依据报道,目前5种属于套式病毒的3CLPro的晶体结构已经被解析,分别是:HCoV 3CLPro、SARS-CoV 3CLPro、EAV 3CLPro、TGEV 3CLPro和PRRSV 3CLPro。他们的3CLPro的晶体结构由3个结构域组成,结构与EAV 3CLPro很相似。N端双β折叠桶由2个结域构组成,2个结构域中间有一裂隙,而蛋白酶的活性中心就存在这一裂隙中。C端结构域的改变将导致酶催化活性的丧失,但具体生物功能有待于进一步研究。虽然冠状病毒3CLPro具有糜蛋白酶样折叠(丝氨酸蛋白酶家族),但是其催化中心仅由His及Cys 2联体组成,而不是由Ser、His、Aps组成的标准3联体,此标准3联体属于丝氨酸蛋白酶家族。而EAV和PRRSV 3CLPro的活性中心由3联体(Ser-His-Asp)组成。
在5种已解析的3CLPro晶体结构中,3种冠状病毒的3CLPro有C2对称性,呈现2聚体形式。SARS-CoV 3CLPro的晶体结构,由1个单体的结构域Ⅱ构成凹槽,另1个单体N-Finger位于这一凹槽中,且它的N1位aa残基Ser的HN-基团与和它结合的单体的aa残基Phe-140、Glu-166的基团形成氢键。于是研究者认为2个单体的的这种相互作用方式可能是构成3CLPro催化中心所必需的,有助于酶与底物酶切位点的特异性结合。后来,有学者通过实验证明N末端在维持SARS-CoV 3CLPro催化中心的构象是必须的,N末端aa的缺失将导致酶活性丧失,但并不影响3CLPro 的二聚化。有研究者发现把TGEV 3CLPro N末端1-5个aa残基截去,则该蛋白酶的水解活性就会丧失。从结构可得出,结构域Ⅲ有助于维持loop184-199和结构域Ⅱ之间的取向,从而形成特定的空间构象便于催化底物。实验结果显示SARS-CoV3CLPro的C端在构成酶二聚化时是必须的。该蛋白的二聚体形成与其在溶液中的溶度有关:把该蛋白结构域Ⅲ截去后,即使蛋白浓度很高(14.88mg/mL),蛋白也无法形成二聚体,且没有催化活性;而结构域Ⅲ单独表达时,即使蛋白溶度很低(0.12mg/mL),蛋白也能形成二聚体,但是该蛋白也没有催化活性。故试验表明结构域Ⅲ有助于SARS-CoV 3CLPro二聚体的形成。
PRRSV 3CLSP有3个结构域组成,包括由2个反向平行的β折叠桶和1个额外C末端α/β区域构成。N末端β折叠桶(结构域Ⅰ)由6个β片(aI to fI)和1个短的α螺旋组成,中间的β折叠桶(结构域Ⅱ)由7个β片(aII to gII)组成,通过1个长的loop环(aa69-89)与结构域I连接。催化位点由保守的Ser118, His39, 和Asp64组成,位于结构域Ⅰ和Ⅱ之间的裂隙中,额外的C末端(结构域Ⅲ)由157~199残基和两对短的反向平行的β片层(aIII–cIII和bIII–dIII)和两个α螺旋组成。
螺旋B和螺旋C的角度约90°。一个长的N末端loop环越过结构域Ⅱ延伸到结构域Ⅲ附近。这个loop环的方向由3个氢结合Arg4 N…Glu100 OE1,Thr5 N…Val99 O和Thr5 OG1…Val99 N所固定。Phe3位于结构域Ⅱ和Ⅲ间的疏水性表面,因此,它也有利于稳定N末端loop环的方向性。
上一篇: 一例鸡喹乙醇中毒的诊治
下一篇: "以养为主"成气候 ——广西钦州渔业养殖跨越发展纪实