14
个编辑
更改
[[冠状病毒]]是一群具有套膜的[[RNA病毒]],在[[电子显微镜]]下呈皇冠状,其[[正性]]单股RNA约由27000~30000多个[[碱基]]组成,为已知最大的RNA病毒,可[[感染]]人、鸡、猪、牛、鼠、猫等动物,会引发呼吸道与[[肠道]]的疾病,并引起人类轻微[[感冒]]。冠状病毒分为三大类,其中两类感染哺乳动物,另一类只感染鸟类,基本上这[[类病毒]]的[[宿主]]相当专一,主要引发呼吸道与肠道感染。2003年新发现的一种冠状病毒,为引起人类[[严重急性呼吸道症候群]]([[SARS]])。
[[严重急性呼吸综合征]]冠状病毒(severe acute respiratory syndrome coronavirus:SARS CoV,SCoV SARS冠状病毒)属与环状[[病毒]](torovirus)属同为[[动脉炎病毒科]](arteriviridae),划作套病毒(nidovims)目。冠状病毒依其[[抗原性]]差异分为3群。SARSCoV与任何一群的[[同源]]性均显不高,有的研究者将其归属于2群。Ksiazek示它可能为两群的[[重组]]病毒。2005年6月Colorado会议提议将SCoV[[分类]]为2群。
SARS冠状病毒在种属分类上属于“ssRNA positive-strand viruses”家系的“Nidovirales”族中的“Coronaviridae”系(见Taxonomy)。它是冠状病毒家族中[[新出]]现的一个子类。全长29,736bp,已知有11个[[编码]]序列(cds),而其中的一个cds(putative orf1ab polyprotein)与鼠类的[[肝炎病毒]](murine hepatitis virus)[[结构]]类似,依据鼠类的肝炎病毒的结构模式,推断出该段cds应该编码了14个[[蛋白质]]。
== SARS冠状病毒概述==
SARS冠状病毒(SARS-Cov),属于巢状病毒目(Order: Nidovirales),冠病毒科(Family:Coronaviridae),冠状病毒属(Genus: Coronavirus)。根据其[[基因]]组结构分类,它属于单链正义 RNA 病毒[(+)sense, ssRNA Virus]。
[[成熟]]的冠状病毒颗粒直径约为 60 至 220nm 不等。其[[形态学]]上最显著的特征在于,在病毒包膜(envelope)外,有明显的棒状膜外子粒('club-shaped' peplomers)。这一酷似中世纪欧洲帝王王冠(crown)的结构(如图 1),正是其”名字” - Coronavirus 的来源。
对其他已知冠状病毒的研究发现,其病毒包膜主要包括三种糖蛋白,分别命名为S 蛋白(Spike Protein)、M 蛋白(Membrane Protein)、E 蛋白(Envelope Protein)。在部分病毒株中还能找到一种 HE 蛋白(Haemagglutinin-esterase)。其中 S 蛋白即伸出包膜的棒-球形的糖蛋白,它在病毒与宿主[[细胞]]表面[[受体]]结合及介导膜融合进入细胞的过程中,起关键性[[作用]],也是冠状病毒主要的[[抗原]]蛋白。M 蛋白则是一种跨膜蛋白,在病毒的包膜形成与[[出芽]](budding)过程中起重要作用。E 蛋白是一种相对较小的蛋白质,主要散在[[分布]]于病毒包膜上。冠状病毒主要结构模式见图 。
冠状病毒入侵宿主细胞。冠状病毒的 S 蛋白是介导冠状病毒入侵宿主细胞的重要[[分子]],
对其配体的研究亦成为关心焦点。目前认为有两类分子可能是冠状病毒的受体:[[氨基]]肽酶 N
(Aminopeptidase N)(图 3a)以及鼠类[[癌胚抗原]]细胞黏[[附分]]子 1(murine CEACAM1)(图
3b)。它们通过与冠状病毒 S 蛋白结合,诱导冠状病毒 S 蛋[[白发]]生结构上的变化,暴露穿膜
有效[[结构域]],介导病毒与宿主细胞[[发生]]膜融合,如图 3c。
位于病毒颗粒中央的不规则[[核酸]]部分即病毒基因组,其上结合有核壳体蛋白(N蛋白,Nucleocapsid Protein)。冠状病毒基因组 RNA(Genomic RNA)是一个无分段的,正义单链 RNA,长度一般在 27-31kb。该 RNA 链具有一个正链 RNA 病毒特有的重要结构特征:即 RNA 链 5`端有甲基化帽(methylated cap)、3`端有 PolyA 尾的结构。这一结构,和真核[[mRNA]] 非常相近,也是其基因组 RNA 自身即可发挥[[翻译]]模板作用的重要结构基础。冠状病毒进入细胞后的[[转录]]、翻译、[[复制]]、装配与出芽过程,如图 4 所示。值得特别指出的是:冠状病毒成熟粒子中,并不存在RNA病毒复制所需的 RNA 聚合酶(Viral RNA polymerase)。因此,它进入宿主细胞之后,首先将直接以病毒基因组 RNA 为翻译模板,表达出病毒 RNA 聚合酶。[[然后]]才利用该酶完成负链亚基因组 RNA (sub-genomic RNA) 的转录合成、各结构蛋白 mRNA 的合成,以及病毒基因组 RNA 的复制。另一个[[需要]]说明的特点是:冠状病毒各个结构蛋白成熟的 mRNA 合成,并不存在转录后的修饰剪切过程,而是直接在初次转录过程中,通过 RNA 聚合酶和一些[[转录因子]],以一种“不连续转录”(discontinuous transcription)的机制,通过识别特定的转录调控序列(transcriptionregulating sequences ,TSR),有选择性地从负义链 RNA 上,一次性转录得到构成一个成熟 mRNA 的全部组成部分。
结构蛋白和基因组 RNA 复制完成后,将在宿主细胞[[内质网]]处装配(assembly)生成新的冠状病毒颗粒,并通过[[高尔基体]]分泌至细胞外,完成其[[生命周期]]。
关于导致 SARS 的[[病原体]],在其研究之初,全球各地的研究组曾经存在过多种推断。3月22日,香港大学[[微生物]]系首先利用非洲绿喉[[肾脏]]细胞(African Green Monkey KidneyCells, Vero E6),从一个感染者的肺[[组织]]中[[分离]]到了一种未知的病毒,推测其很可能即为致病原。WHO 的研究网络随即集中对该病毒进行了分析,并且在3月27日的简报中首次提到了”病原体可能是冠状病毒的一种”。此后两周内,该研究网络的多个实验室对SARS进行了临床[[标本]]、病理组织与[[影像]]学、病毒分离培养、[[血清]]学与[[免疫学]]诊断、[[分子生物学]]与[[遗传]]同源性等多方面的深入研究与[[鉴定]],最终[[确认]]:一种新的冠状病毒(Coronavirus),
就是导致严重急性呼吸综合征的病原体!
== SARS 冠状病毒基因组学研究==
4月12日,加拿大 British Columbia Cancer Agency’s Genome Sciences Centre 首先完成了SARS 冠状病毒的全基因组测序(Accession Number: AY274119)。我国[[中国科学院]]华大基因组研究中心,也于4月16日完成了5个SARS病毒分离株的测序工作。截至5月9日,已提交到 GeneBank 的完整 SARS 基因组序列达11条。其基本[[信息]]见表 1。[[NCBI]] 参照上述各 序 列 , 以Tor2基因组序列为蓝本 , [[修正]]给出了SARS的基因组参考序列(AC:NC_004718)。
表1.已完成测序的 SARS 冠状病毒全基因组序列 (截至 2003.5.9)
通过与已知冠状病毒基因组的[[比较]]分析,三个完成测序的研究组-USCCDC、加拿大BCCA 基因组研究所、北京华大基因组研究中心,分别基于 Urbani/Tor2/BJ01的序列,对 SARS冠状病毒的基因组结构进行了分析预测,并发表了各自的工作。三个病毒株的分析结果基本一致,认为 SARS 冠状病毒基因组属于典型的缺乏 HE 蛋白的冠状病毒[HE(-)-Coronavirus]
基因组结构。其基因组 5’端约三分之二的区域,编码病毒 RNA 聚合酶复合蛋白;后三分之一的区域,编码病毒结构蛋白,按基因组上的排列顺序依次为 S 蛋白、E 蛋白、M 蛋白、N蛋白;未发现 HE 蛋白编码序列。已发表的 USCDC、加拿大、北京华大的基因组结构图分别如图 5-7 所示。
上述三篇基因组分析论文10-12均指出在结构蛋白编码区可能的开放读码框(Open Reading Frame, ORF)中,存在已有蛋白质序列[[数据库]]中未找到任何同源序列的未知蛋白(Predicted Unknown Protein, PUP)。但是在具体的PUP数目和位置上,各组之间的结论存在一定的差异。其中USCDC对Urbani和北京华大对BJ01的分析,均报道发现了5个PUP;加拿大Tor2的分析则报道发现了9个可能的未知ORF和1个s2m motif。本研究在4月26日,即基于Genebank已有的基因组序列,参考 NCBI 的简要注释,对其进行了[[系统]]的同源性检索分析,并在第一时间发布,分析其结果与随后发表的上述三篇论文基本一致20。现以加拿大Tor2的分析结果为参照,将三地对于未知蛋白的结果罗列如下:
表2. Tor2 / Urbani /BJ01 基因组中未知蛋白 ORF 的预测对比
此外,加拿大和美国的研究组,均对冠状病毒基因组的5’端非翻译区(UTR)和各个 ORF起始密码子上游的区域进行了分析,以期待寻找到类似于其他冠状病毒”UCUAAAC”的,参与“不连续转录”识别的特征性TRS(转录调控序列)。两个研究组均在orf1a、S蛋白、X1(即 Tor2 ORF3 )、M 蛋白、X4(即 Tor2 ORF8)、X5(即 Tor2 ORF9)和 N 蛋白上游,发现了一个保守的8个[[核苷酸]]的 TRS――”AAACGAAC”。另外,加拿大的研究还显示在其他几个ORF上游,也有类似的TRS。(如表 3 所示)。上述发现,进一步支持了冠状病毒的不连续转录模型,也为ORF预测的准确性提供了强有力的证据。
另外,上述诸研究组的分析工作还发现了一些细节的结构现象。加拿大的研究提到在 3’端非编码区,存在一个保守的 s2m motif。这个在某些病毒中广泛存在的结构可能对于了解SARS 冠状病毒的来源有提示作用。中国 BJ01 的分析结果还发现了至少四个单位长度在 7个碱基以上的回文结构(palindromes)、140 多个可能形成发夹结构(hairpin)的片段,以及发现 BJ01 基因组上 155-211/861-920 这两个区域内的大约 60 个碱基出现重复现象12。上述有趣的基因组现象的[[生物学]]意义均有待进一步研究证实。
== SARS CoV 突变与 SARS 系统发生关系(Phylogenetic)分析==
由于 SARS 是一种突发的严重[[传染]]性疾病,[[短期]]内在多个国家均有感染及死亡报道。因此,分析比较不同地区 SARS 病毒的序列差异与[[突变]]状况,对于了解疾病的传染过程、病毒的[[毒力]]变化以及[[控制]]该疾病的[[传播]],都具有非常重要的意义。另外,运用[[比较基因组学]]的[[方法]],了解 SARS 冠状病毒与已知冠状病毒的[[系统发生]]关系,以确定 SARS Coronavirus 的可能来源与种属分类,也是 SARS 研究的重要课题。
本研究组于 4 月底,利用当时已发表的 9 个不同来源的 SARS 基因组序列,对其 S 蛋白的编码区序列多样性进行了分析,并以 S 蛋白质编码基因为对象,绘制出了序列已公布的几个 SARS 病毒株的系统发生树。5 月 1 日,在北京基因组中心提交 BJ01 全基因组序列之后,随即根据新的 5 条全基因组序列修正了上述 S 蛋白基因组序列突变分析,并进行了全基因组的碱基替换与[[氨基酸]]突变分析。所得结果,与北京基因组中心随后发表的论文所述基本一致(碱基替换分布如图 8)。
北京基因组中心在其发表的工作中,着重比较分析了 BJ01/Urbani/Tor2/CUHK/HKU 等五个病毒株全基因组的碱基替换(substitution)情况及其对编码氨基酸的影响。总共发现了31个碱基替换位点, 计算总[[突变率]]约为.0.10%; 其中有义突变(non-synonymous substitution)15个。具体突变的数目及分布情况见表 4。
表 4. BJ01/Urbani/Tor2/CUHK/HKU 全基因组碱基替换分析明细表
整体突变率显示,不同地源的SARS冠状病毒基因组,至少在上述病毒株[[采样]]期间,[[保持]]了相对[[稳定]]。从绝对数量上看,突变部位主要集中在RNA聚合酶区域,但是考虑到突变ORF的长度,则显示结构蛋白编码区的突变率要大大高于聚合酶编码区,未知蛋白质区域的突变率高于结构蛋白。这一结构上的突变分布规律,与病毒[[功能]]上的稳定性具有一定的一致性。
上述突变规律的研究,对于SARS冠状病毒的防治有着十分重要的意义:首先,RNA聚合酶的保守性,进一步证实了病毒 RNA 聚合酶合成的[[独立]]性,也提示RNA聚合酶可能为抗SARS[[药物]]设计提供重要靶点。抗HIV药物中的聚合酶[[抑制]]剂的成功思路,可能也适用于SARS冠状病毒。其次,S蛋白质的突变,尤其是高比例的有义突变(3/4),提示S蛋白可能是病毒诱发机体[[免疫系统]]生成[[抗体]],及发生细胞[[毒性]]的[[T细胞]][[免疫]][[反应]]的主要抗原蛋白。这对于了解SARS的急性[[损伤]]机制,制备SARS冠状病毒[[特异性]]抗体及[[疫苗]],都有着十分重要的意义。
另外,新加坡基因组中心于5月9日发表了对14条SARS全长或[[部分基因组]]序列的比较分析结果,对世界各地 SARS病毒的突变及演化关系进行了深入分析。虽然由于其选用的BJ01的序列为5月 1 日修正之前的数据,使得其突变分析结果有待改进,但是他们对于各地SARS病毒相互之间演化关系的推断,还是具有相当重要的启发意义和较高参考价值的。
从上述分析工作来看,SARS 冠状病毒是一个比较稳定的病毒(但也不排除在未来其会有大规模的[[变异]])。这个结果为我们提供了喜忧参半的信息:其稳定性有利于机[[体针]]对病毒特异性抗体的生成,降低二次感染可能性,并增加了疫苗研究的可行性;但同时也意味着病毒随[[传代]]毒力减低的可能性减小,给疾病的流行控制增加了难度。当然,要回答“SARS 病毒变还是不变?怎么变?”的问题,仅仅这些简单而有限的分析是远远不够的,还需要依赖于对不同地域、不同时间、不[[同感]]染者来源的更多病毒株的测序资料,以及更为广泛深入的临床与实验研究。
在系统发生(Phylogenetic)方面,已知的冠状病毒,根据血清学证据和种属发生学规律,分为 3 个 Group。其中 Group1,2 包括有多种哺乳动物冠状病毒,Group3 仅有鸟感染性[[支气管]]炎病毒(Avian infectious bronchitis virus, IBV)。序列同源性的分析表明,SARS 冠状病毒与已知各种冠状病毒的同源性都不高(见表 5)。
因此,作为一种新发现的冠状病毒,确定SARS CoV的系统发生学位置与种属关系,是病毒学研究的重要课题。在缺乏血清学系统认证的情况下,前面提及的美、加、中三个研究组在发表各自基因组分析结果的同时,都基于核酸或冠状病毒重要编码蛋白的氨基酸序列,对SARS CoV进行了系统发生学分析(Phylogenetic Analyses)。北京研究组的系统发生树,是基于Genebank中已有收载的17种不同的冠状病毒 RNA 聚合酶的核酸和氨基酸序列;USCDC则利用全基因组序列已知的 7 种冠状病毒的6个重要蛋白质氨基酸序列,绘制系统发生树(见图 9),加拿大的工作与USCDC基本类似。上述工作均显示SARS CoV无法归于现有的任何一个Group,且在系统发生上与其他3个 Group 的成员基本上是等距离的。这一结果与序列同源[[比对]]的数据也是一致的。北京大学疾病基因研究中心生物信息组,在4月底也曾基于SARS CoV的S蛋白和orf1a序列,对其进行了同源比对和种系进化分析,其结论得到了随后发表论文的证实。
== 最新科学文献==
(CMBI-PUCHG Since 5.7)
(CMBI-PUCHG Since 4.26)
(CMAJ-2004.1.6)
(CMAJ-2004.1.6)
(J Clin Virology-2004,vol29)
(JBC-2004.1)
(JAMA-12.24)
(JAMA-12.24)
(J Clin Virology-2003,vol28)
(J Clin Virology-2003,vol28)
(J Clin Virology-2003,vol28)
(Nature-10.30)
(PNAS-10.28)
(Science-10.10)
(Sciencexpress-9.4)
(Lancet-8.16)
(N Engl J Med-8.14)
(N Engl J Med-8.14)
(N Engl J Med-8.14)
(Lancet-8.12)
(Mayo Clin Proc-7)
(Mayo Clin Proc-7)
(N Engl J Med-7.31)
(N Engl J Med-7.31)
(Lancet-7.26)
(Lancet-7.26)
(N Engl J Med-7.24)
(Nature-7.10)
(N Engl J Med-7.10)
{{zk120}}
[[严重急性呼吸综合征]]冠状病毒(severe acute respiratory syndrome coronavirus:SARS CoV,SCoV SARS冠状病毒)属与环状[[病毒]](torovirus)属同为[[动脉炎病毒科]](arteriviridae),划作套病毒(nidovims)目。冠状病毒依其[[抗原性]]差异分为3群。SARSCoV与任何一群的[[同源]]性均显不高,有的研究者将其归属于2群。Ksiazek示它可能为两群的[[重组]]病毒。2005年6月Colorado会议提议将SCoV[[分类]]为2群。
SARS冠状病毒在种属分类上属于“ssRNA positive-strand viruses”家系的“Nidovirales”族中的“Coronaviridae”系(见Taxonomy)。它是冠状病毒家族中[[新出]]现的一个子类。全长29,736bp,已知有11个[[编码]]序列(cds),而其中的一个cds(putative orf1ab polyprotein)与鼠类的[[肝炎病毒]](murine hepatitis virus)[[结构]]类似,依据鼠类的肝炎病毒的结构模式,推断出该段cds应该编码了14个[[蛋白质]]。
== SARS冠状病毒概述==
SARS冠状病毒(SARS-Cov),属于巢状病毒目(Order: Nidovirales),冠病毒科(Family:Coronaviridae),冠状病毒属(Genus: Coronavirus)。根据其[[基因]]组结构分类,它属于单链正义 RNA 病毒[(+)sense, ssRNA Virus]。
[[成熟]]的冠状病毒颗粒直径约为 60 至 220nm 不等。其[[形态学]]上最显著的特征在于,在病毒包膜(envelope)外,有明显的棒状膜外子粒('club-shaped' peplomers)。这一酷似中世纪欧洲帝王王冠(crown)的结构(如图 1),正是其”名字” - Coronavirus 的来源。
对其他已知冠状病毒的研究发现,其病毒包膜主要包括三种糖蛋白,分别命名为S 蛋白(Spike Protein)、M 蛋白(Membrane Protein)、E 蛋白(Envelope Protein)。在部分病毒株中还能找到一种 HE 蛋白(Haemagglutinin-esterase)。其中 S 蛋白即伸出包膜的棒-球形的糖蛋白,它在病毒与宿主[[细胞]]表面[[受体]]结合及介导膜融合进入细胞的过程中,起关键性[[作用]],也是冠状病毒主要的[[抗原]]蛋白。M 蛋白则是一种跨膜蛋白,在病毒的包膜形成与[[出芽]](budding)过程中起重要作用。E 蛋白是一种相对较小的蛋白质,主要散在[[分布]]于病毒包膜上。冠状病毒主要结构模式见图 。
冠状病毒入侵宿主细胞。冠状病毒的 S 蛋白是介导冠状病毒入侵宿主细胞的重要[[分子]],
对其配体的研究亦成为关心焦点。目前认为有两类分子可能是冠状病毒的受体:[[氨基]]肽酶 N
(Aminopeptidase N)(图 3a)以及鼠类[[癌胚抗原]]细胞黏[[附分]]子 1(murine CEACAM1)(图
3b)。它们通过与冠状病毒 S 蛋白结合,诱导冠状病毒 S 蛋[[白发]]生结构上的变化,暴露穿膜
有效[[结构域]],介导病毒与宿主细胞[[发生]]膜融合,如图 3c。
位于病毒颗粒中央的不规则[[核酸]]部分即病毒基因组,其上结合有核壳体蛋白(N蛋白,Nucleocapsid Protein)。冠状病毒基因组 RNA(Genomic RNA)是一个无分段的,正义单链 RNA,长度一般在 27-31kb。该 RNA 链具有一个正链 RNA 病毒特有的重要结构特征:即 RNA 链 5`端有甲基化帽(methylated cap)、3`端有 PolyA 尾的结构。这一结构,和真核[[mRNA]] 非常相近,也是其基因组 RNA 自身即可发挥[[翻译]]模板作用的重要结构基础。冠状病毒进入细胞后的[[转录]]、翻译、[[复制]]、装配与出芽过程,如图 4 所示。值得特别指出的是:冠状病毒成熟粒子中,并不存在RNA病毒复制所需的 RNA 聚合酶(Viral RNA polymerase)。因此,它进入宿主细胞之后,首先将直接以病毒基因组 RNA 为翻译模板,表达出病毒 RNA 聚合酶。[[然后]]才利用该酶完成负链亚基因组 RNA (sub-genomic RNA) 的转录合成、各结构蛋白 mRNA 的合成,以及病毒基因组 RNA 的复制。另一个[[需要]]说明的特点是:冠状病毒各个结构蛋白成熟的 mRNA 合成,并不存在转录后的修饰剪切过程,而是直接在初次转录过程中,通过 RNA 聚合酶和一些[[转录因子]],以一种“不连续转录”(discontinuous transcription)的机制,通过识别特定的转录调控序列(transcriptionregulating sequences ,TSR),有选择性地从负义链 RNA 上,一次性转录得到构成一个成熟 mRNA 的全部组成部分。
结构蛋白和基因组 RNA 复制完成后,将在宿主细胞[[内质网]]处装配(assembly)生成新的冠状病毒颗粒,并通过[[高尔基体]]分泌至细胞外,完成其[[生命周期]]。
关于导致 SARS 的[[病原体]],在其研究之初,全球各地的研究组曾经存在过多种推断。3月22日,香港大学[[微生物]]系首先利用非洲绿喉[[肾脏]]细胞(African Green Monkey KidneyCells, Vero E6),从一个感染者的肺[[组织]]中[[分离]]到了一种未知的病毒,推测其很可能即为致病原。WHO 的研究网络随即集中对该病毒进行了分析,并且在3月27日的简报中首次提到了”病原体可能是冠状病毒的一种”。此后两周内,该研究网络的多个实验室对SARS进行了临床[[标本]]、病理组织与[[影像]]学、病毒分离培养、[[血清]]学与[[免疫学]]诊断、[[分子生物学]]与[[遗传]]同源性等多方面的深入研究与[[鉴定]],最终[[确认]]:一种新的冠状病毒(Coronavirus),
就是导致严重急性呼吸综合征的病原体!
== SARS 冠状病毒基因组学研究==
4月12日,加拿大 British Columbia Cancer Agency’s Genome Sciences Centre 首先完成了SARS 冠状病毒的全基因组测序(Accession Number: AY274119)。我国[[中国科学院]]华大基因组研究中心,也于4月16日完成了5个SARS病毒分离株的测序工作。截至5月9日,已提交到 GeneBank 的完整 SARS 基因组序列达11条。其基本[[信息]]见表 1。[[NCBI]] 参照上述各 序 列 , 以Tor2基因组序列为蓝本 , [[修正]]给出了SARS的基因组参考序列(AC:NC_004718)。
表1.已完成测序的 SARS 冠状病毒全基因组序列 (截至 2003.5.9)
通过与已知冠状病毒基因组的[[比较]]分析,三个完成测序的研究组-USCCDC、加拿大BCCA 基因组研究所、北京华大基因组研究中心,分别基于 Urbani/Tor2/BJ01的序列,对 SARS冠状病毒的基因组结构进行了分析预测,并发表了各自的工作。三个病毒株的分析结果基本一致,认为 SARS 冠状病毒基因组属于典型的缺乏 HE 蛋白的冠状病毒[HE(-)-Coronavirus]
基因组结构。其基因组 5’端约三分之二的区域,编码病毒 RNA 聚合酶复合蛋白;后三分之一的区域,编码病毒结构蛋白,按基因组上的排列顺序依次为 S 蛋白、E 蛋白、M 蛋白、N蛋白;未发现 HE 蛋白编码序列。已发表的 USCDC、加拿大、北京华大的基因组结构图分别如图 5-7 所示。
上述三篇基因组分析论文10-12均指出在结构蛋白编码区可能的开放读码框(Open Reading Frame, ORF)中,存在已有蛋白质序列[[数据库]]中未找到任何同源序列的未知蛋白(Predicted Unknown Protein, PUP)。但是在具体的PUP数目和位置上,各组之间的结论存在一定的差异。其中USCDC对Urbani和北京华大对BJ01的分析,均报道发现了5个PUP;加拿大Tor2的分析则报道发现了9个可能的未知ORF和1个s2m motif。本研究在4月26日,即基于Genebank已有的基因组序列,参考 NCBI 的简要注释,对其进行了[[系统]]的同源性检索分析,并在第一时间发布,分析其结果与随后发表的上述三篇论文基本一致20。现以加拿大Tor2的分析结果为参照,将三地对于未知蛋白的结果罗列如下:
表2. Tor2 / Urbani /BJ01 基因组中未知蛋白 ORF 的预测对比
此外,加拿大和美国的研究组,均对冠状病毒基因组的5’端非翻译区(UTR)和各个 ORF起始密码子上游的区域进行了分析,以期待寻找到类似于其他冠状病毒”UCUAAAC”的,参与“不连续转录”识别的特征性TRS(转录调控序列)。两个研究组均在orf1a、S蛋白、X1(即 Tor2 ORF3 )、M 蛋白、X4(即 Tor2 ORF8)、X5(即 Tor2 ORF9)和 N 蛋白上游,发现了一个保守的8个[[核苷酸]]的 TRS――”AAACGAAC”。另外,加拿大的研究还显示在其他几个ORF上游,也有类似的TRS。(如表 3 所示)。上述发现,进一步支持了冠状病毒的不连续转录模型,也为ORF预测的准确性提供了强有力的证据。
另外,上述诸研究组的分析工作还发现了一些细节的结构现象。加拿大的研究提到在 3’端非编码区,存在一个保守的 s2m motif。这个在某些病毒中广泛存在的结构可能对于了解SARS 冠状病毒的来源有提示作用。中国 BJ01 的分析结果还发现了至少四个单位长度在 7个碱基以上的回文结构(palindromes)、140 多个可能形成发夹结构(hairpin)的片段,以及发现 BJ01 基因组上 155-211/861-920 这两个区域内的大约 60 个碱基出现重复现象12。上述有趣的基因组现象的[[生物学]]意义均有待进一步研究证实。
== SARS CoV 突变与 SARS 系统发生关系(Phylogenetic)分析==
由于 SARS 是一种突发的严重[[传染]]性疾病,[[短期]]内在多个国家均有感染及死亡报道。因此,分析比较不同地区 SARS 病毒的序列差异与[[突变]]状况,对于了解疾病的传染过程、病毒的[[毒力]]变化以及[[控制]]该疾病的[[传播]],都具有非常重要的意义。另外,运用[[比较基因组学]]的[[方法]],了解 SARS 冠状病毒与已知冠状病毒的[[系统发生]]关系,以确定 SARS Coronavirus 的可能来源与种属分类,也是 SARS 研究的重要课题。
本研究组于 4 月底,利用当时已发表的 9 个不同来源的 SARS 基因组序列,对其 S 蛋白的编码区序列多样性进行了分析,并以 S 蛋白质编码基因为对象,绘制出了序列已公布的几个 SARS 病毒株的系统发生树。5 月 1 日,在北京基因组中心提交 BJ01 全基因组序列之后,随即根据新的 5 条全基因组序列修正了上述 S 蛋白基因组序列突变分析,并进行了全基因组的碱基替换与[[氨基酸]]突变分析。所得结果,与北京基因组中心随后发表的论文所述基本一致(碱基替换分布如图 8)。
北京基因组中心在其发表的工作中,着重比较分析了 BJ01/Urbani/Tor2/CUHK/HKU 等五个病毒株全基因组的碱基替换(substitution)情况及其对编码氨基酸的影响。总共发现了31个碱基替换位点, 计算总[[突变率]]约为.0.10%; 其中有义突变(non-synonymous substitution)15个。具体突变的数目及分布情况见表 4。
表 4. BJ01/Urbani/Tor2/CUHK/HKU 全基因组碱基替换分析明细表
整体突变率显示,不同地源的SARS冠状病毒基因组,至少在上述病毒株[[采样]]期间,[[保持]]了相对[[稳定]]。从绝对数量上看,突变部位主要集中在RNA聚合酶区域,但是考虑到突变ORF的长度,则显示结构蛋白编码区的突变率要大大高于聚合酶编码区,未知蛋白质区域的突变率高于结构蛋白。这一结构上的突变分布规律,与病毒[[功能]]上的稳定性具有一定的一致性。
上述突变规律的研究,对于SARS冠状病毒的防治有着十分重要的意义:首先,RNA聚合酶的保守性,进一步证实了病毒 RNA 聚合酶合成的[[独立]]性,也提示RNA聚合酶可能为抗SARS[[药物]]设计提供重要靶点。抗HIV药物中的聚合酶[[抑制]]剂的成功思路,可能也适用于SARS冠状病毒。其次,S蛋白质的突变,尤其是高比例的有义突变(3/4),提示S蛋白可能是病毒诱发机体[[免疫系统]]生成[[抗体]],及发生细胞[[毒性]]的[[T细胞]][[免疫]][[反应]]的主要抗原蛋白。这对于了解SARS的急性[[损伤]]机制,制备SARS冠状病毒[[特异性]]抗体及[[疫苗]],都有着十分重要的意义。
另外,新加坡基因组中心于5月9日发表了对14条SARS全长或[[部分基因组]]序列的比较分析结果,对世界各地 SARS病毒的突变及演化关系进行了深入分析。虽然由于其选用的BJ01的序列为5月 1 日修正之前的数据,使得其突变分析结果有待改进,但是他们对于各地SARS病毒相互之间演化关系的推断,还是具有相当重要的启发意义和较高参考价值的。
从上述分析工作来看,SARS 冠状病毒是一个比较稳定的病毒(但也不排除在未来其会有大规模的[[变异]])。这个结果为我们提供了喜忧参半的信息:其稳定性有利于机[[体针]]对病毒特异性抗体的生成,降低二次感染可能性,并增加了疫苗研究的可行性;但同时也意味着病毒随[[传代]]毒力减低的可能性减小,给疾病的流行控制增加了难度。当然,要回答“SARS 病毒变还是不变?怎么变?”的问题,仅仅这些简单而有限的分析是远远不够的,还需要依赖于对不同地域、不同时间、不[[同感]]染者来源的更多病毒株的测序资料,以及更为广泛深入的临床与实验研究。
在系统发生(Phylogenetic)方面,已知的冠状病毒,根据血清学证据和种属发生学规律,分为 3 个 Group。其中 Group1,2 包括有多种哺乳动物冠状病毒,Group3 仅有鸟感染性[[支气管]]炎病毒(Avian infectious bronchitis virus, IBV)。序列同源性的分析表明,SARS 冠状病毒与已知各种冠状病毒的同源性都不高(见表 5)。
因此,作为一种新发现的冠状病毒,确定SARS CoV的系统发生学位置与种属关系,是病毒学研究的重要课题。在缺乏血清学系统认证的情况下,前面提及的美、加、中三个研究组在发表各自基因组分析结果的同时,都基于核酸或冠状病毒重要编码蛋白的氨基酸序列,对SARS CoV进行了系统发生学分析(Phylogenetic Analyses)。北京研究组的系统发生树,是基于Genebank中已有收载的17种不同的冠状病毒 RNA 聚合酶的核酸和氨基酸序列;USCDC则利用全基因组序列已知的 7 种冠状病毒的6个重要蛋白质氨基酸序列,绘制系统发生树(见图 9),加拿大的工作与USCDC基本类似。上述工作均显示SARS CoV无法归于现有的任何一个Group,且在系统发生上与其他3个 Group 的成员基本上是等距离的。这一结果与序列同源[[比对]]的数据也是一致的。北京大学疾病基因研究中心生物信息组,在4月底也曾基于SARS CoV的S蛋白和orf1a序列,对其进行了同源比对和种系进化分析,其结论得到了随后发表论文的证实。
== 最新科学文献==
(CMBI-PUCHG Since 5.7)
(CMBI-PUCHG Since 4.26)
(CMAJ-2004.1.6)
(CMAJ-2004.1.6)
(J Clin Virology-2004,vol29)
(JBC-2004.1)
(JAMA-12.24)
(JAMA-12.24)
(J Clin Virology-2003,vol28)
(J Clin Virology-2003,vol28)
(J Clin Virology-2003,vol28)
(Nature-10.30)
(PNAS-10.28)
(Science-10.10)
(Sciencexpress-9.4)
(Lancet-8.16)
(N Engl J Med-8.14)
(N Engl J Med-8.14)
(N Engl J Med-8.14)
(Lancet-8.12)
(Mayo Clin Proc-7)
(Mayo Clin Proc-7)
(N Engl J Med-7.31)
(N Engl J Med-7.31)
(Lancet-7.26)
(Lancet-7.26)
(N Engl J Med-7.24)
(Nature-7.10)
(N Engl J Med-7.10)
{{zk120}}