冠状动脉疾病全基因关联分析研究进展

关键词: 冠状动脉疾病,心肌梗塞,全基因组关联分析,单核苷酸多态性 经典2010

中文摘要:冠状动脉疾病(coronary artery disease, CAD)和心肌梗塞(myocardial infarction, MI)是全世界范围内致死率较高的疾病之一,是一类遗传和环境因素参与发病的复杂性疾病。全基因组关联分析(genomewide association studies, GWAS)是近5年快速发展的研究复杂性疾病机制的新方法,目前已经有超过7个GWAS项目发现了10多个CAD/MI易感位点,加深并拓宽了对于CAD/MI分子机制的认识,但GWAS在应用中仍有其局限性。本文总结了目前已完成的应用GWAS研究CAD/MI的项目,分析了其中存在的问题,并对未来更有效地应用GWAS策略进行相关研究进行探讨。

背景

冠状动脉疾病(coronary artery disease,CAD)是全世界范围内患病率和死亡最高的疾病之一[1],我国每年死于CAD超过70万人,并有逐年升高的趋势,是严重威胁人类健康的重大疾病。

CAD是一类由遗传因素和环境因素共同导致的复杂性疾病 [2-3]。流行病学研究显示多种与环境相关的危险因素可导致CAD和MI [4],而除环境因素外,CAD的家族聚集性提示遗传因素在CAD的发病过程中也发挥了非常重要的作用。基于家系的连锁分析方法和基于散发人群的关联分析方法是遗传学上进行疾病致病基因研究的两种主要手段,但是对于CAD等一类的复杂性疾病,由于晚发病率和遗传异质性较高,故应用CAD家系进行连锁分析具有较大局限。

随着测序及基因芯片技术的发展,全基因组关联分析(genomewide association studies,GWAS)是近5年来快速发展的遗传学定位新策略,该方法主要应用上百万个可以覆盖人类全基因组的单核苷酸多态性(single nucleotide polymorphism,SNP)对个体进行全基因组扫描,并通过大样本的病例-对照关联分析,以发现人类性状或复杂性疾病的易感基因或SNP位点。自2005年Science杂志首次报道年龄相关性视网膜黄斑变性GWAS结果以来,引发了第一波GWAS热潮。截至2009年,短短数年间已有超过438项GWAS项目[5-6],GWAS也使得CAD/MI的遗传学及分子机制的研究迈上了一个新台阶。本文结合CAD/MI的GWAS进展,综述冠状动脉疾病GWAS的研究现状,分析其中存在的问题并探讨GWAS后时代的冠状动脉疾病基因组学的研究方向。

冠状动脉疾病GWAS现状

2007年5月,Anna Helgadottir等[7]Science发表论文,该研究小组利用Illumina Hap300 chip(305,953个SNPs)在冰岛人群中率先开展了CAD的GWAS研究(4,587 cases vs12,769 controls),并最终发现了与MI/CAD相关的易感位点--9p21。无独有偶,Ruth McPherson等[8]也在Science同次刊物上发表了一篇关于CAD的GWAS论文,他们利用100,000个SNPs在6个高加索人群中发现了与CAD高度相关的位点--9p21。这两项研究的最大特点在于,与以往连锁分析和候选基因关联分析不同,第一次在全基因组水平上对CAD/MI的易感位点进行全面考察,发现了CAD/MI的第一个易感位点9p21,在CAD/MI遗传学研究史上具有里程碑似的意义。

随后,应用GWAS策略,多个小组也开展了CAD/MI遗传特征的研究。2007年6月,WTCCC(The Wellcome Trust Case Control Consortium)[9]利用14,000个病例和3,000个正常对照人进行了包括CAD在内的7种疾病的GWAS,覆盖全基因组超过50万个SNP,研究人群同样是欧洲白种人群,结果发现数个与CAD相关的易感位点(p<10-7),9p21是其中与CAD相关性最高的SNP,其余还包括1q43,5q21,6q25,16q23,19q12和22q12等多个SNP,该GWAS分析全面并考虑了人种和地理因素,最大限度地降低了假阳性率,但不足之处在于缺少验证群体的结果。2007年8月, Samani NJ等[10]NEJM上发表了另一篇关于CAD的GWAS,他们结合WTCCC和German MI study的研究结果进行验证分析后,发现3个SNP位点在两个群体中均为显著,其中9p21最高,6q25.1 和2q36.3则较弱,他们同时将两个群体进行合并分析(combined analysis)后又发现4个新的与CAD相关SNP位点:1p13.3,1q41,10q11.21和15q22.33。2009年2月,Myocardial Infarction Genetics Consortium [11]Nature Genetics发表了与MI相关的GWAS项目,该小组在全基因组上同时考察SNP和CNVs(copy number variants)与MI的关联,研究个体总数超过6,000人(2,967 cases vs 3,075 controls),结果发现数个与MI相关SNP位点,其中6个SNP位点(9p21, 1p13,10q11 1q41 19p13和1p32)在既往研究中也已被发现,另外3个位点(21q22,6p24 和2q33)则是该研究中首次发现的新位点。

上述GWAS项目是CAD和MI研究全基因组分析中最具有代表性的试验,截止目前,CAD/MI的GWAS项目超过了7个,表1综合归纳了近年来GWAS发现的与CAD/MI相关的易感位点。尽管实践证明GWAS是研究多基因疾病的一种有效的方法,但是目前易感基因及位点发现的进程还是比较缓慢,并且,在其实施过程中反映出的一些问题也值得我们讨论和深思。

表1 截至2010年应用GWAS发现的与CAD/MI相关的易感位点

NO

易感位点

SNP

附近的基因

参考文献

1

9p21

rs1333048

CDKN2A/B-ANRIL

7,8,9,10,11

2

1p13

rs646776

CELSR2-PSRC1-SORT1

9,10

3

21q22

rs9982601

SLC5A3-MRPS6-KCNE2

9

4

1q41

rs17465637

MIA3

  9,10

5

10q11

rs1746048

CXCL12

  9,10

6

6p24

rs12526453

PHACTR1

9

7

19p13

rs1122608

LDLR

9

8

2q33

rs6725887

WDR12

9

9

1p32

rs11206510

PCSK9

9

10

12q24

rs2259816

HNF1A

11

11

12q24

rs3184504

SH2B3

12

12

3q22

rs9818870

MRAS

11

13

6q26-27

rs3798220

LPA

13,14

rs10455872

LPA

13

3  冠状动脉疾病GWAS中存在的问题

纵观2007到2010年间CAD/MI的GWAS项目,可以发现在基因芯片上集成的SNPs越来越多,其集成密度可达500kbp,而且GWAS的研究群体规模也越来越大,其在设计和实施中主要应满足条件包括:(1)明确的纳入和排除标准;(2)考虑人种和地理因素造成的混淆影响,例如Genomic control;(3)应用多种分型平台;(4)样本量满足统计效率;(5)统计方法准确有效;(6)对于芯片发现的易感位点,需要有2个以上独立样本的验证。上述6点对GWAS提出了很高的要求,这使得GWAS从实施开始就需要花费大量的时间和经费。

随着对CAD/MI遗传机制的不断深入,GWAS也慢慢显示出了一些局限性,通过GWAS发现的许多SNP位点并不影响蛋白质中氨基酸,甚至许多SNP位点不在蛋白编码开放阅读框内,这为解释SNP位点与性状/复杂性疾病产生之间的关系造成了一定的困难,由于缺乏分子生物学证据,因此GWAS的结果有时显得扑朔迷离。综合而言,目前GWAS主要存在以下4个问题:

(1)很多GWAS发现的易感位点在内含子或没有发现已知基因的区域。表1中列举的SNP除9p21(rs1333049)位于ANRIL的内含子里,而其余大部分报道与CAD/MI的SNPs在前后10 kb范围内目前没有发现已知基因。出现这种现象原因可能是目前GWAS发现的这些SNPs仅仅是一个marker,其与功能性SNPs可能位于同一个连锁不平衡( linkage disequilibrium,LD),而这个LD区域在不同的人种间可能不同,这或许也可以解释为什么在欧洲人群里面发现的位点在其它人群里面得不到验证的原因;并且由于缺乏功能实验的证据,对于已经发现并证实的位点,目前也很难搞清楚易感位点与CAD/MI内在的分子机制;复杂性疾病往往是多个基因参与累积形成的数量性状,SNP可能通过影响基因的转录产物和表达产物水平从而导致疾病,因此针对SNP的功能分析将是GWAS研究的一个重要组成部分,例如sort1基因是由GWAS发现的易感基因与胆固醇水平和MI相关,Kiran Musunuru等[17]经过一些系列的研究表明sort基因里面的一个SNP(rs12740374)产生了一个C/EBP(CCAAT增强子结合蛋白)转录因子结合位点从而影响了sort1基因的表达,通过老鼠肝脏的siRNA干扰实验,表明sort1通过调节VLDL的分泌来改变胞质LDL-C和VLDL的水平,最终在MI的发生中起了重要的作用。

(2)GWAS发现的易感位点仅少数能在多个群体中验证。自9p21发现是CAD/MI相关的易感位点以来,它不仅在多个GWAS项目中得到证实[7-11],而且在其它种族中证实同样是CAD/MI的易感位点,Gongqing Sheng等是第一个研究小组在亚洲人群中证实9p21与CAD/MI相关[15-16];除9p21之外,几乎没有SNP位点能在2个以上GWAS中得到验证,或者欧洲人群中GWAS项目发现的阳性位点在亚洲人群中难以验证,我们最近的研究则发现除了少数SNP位点外,大部分在高加索人群中通过GWAS发现的与CAD相关的SNP位点也难以在中国CAD/MI人群中验证(数据尚未发表)。这种现象可能系由于CAD/MI遗传异质性较高,或各个种族人群结构具有一定的差异,或统计效率不够引起假阴性等原因。

(3)易感基因之间及其与环境因素之间交互作用分析工具缺乏。GWAS的核心思想是在全基因组的水平上逐个考察单个SNP与CAD/MI之间的关联性,如果达到显著性标准,则进行验证,但是这样的策略并没有能够有效解释复杂性疾病的核心,即“多因微效”理论。目前GWAS的逐个SNP位点扫描方法只能发现遗传效应(genetic effect)较高的SNP位点,遗传效应相对较低的SNP位点及多个SNP累积作用则很难被发现,目前还缺乏有效的综合分析这些显著SNP位点之间的交互作用,以及遗传位点与环境因素之间相互作用的工具。

(4)由于统计效率的要求,GWAS一般能检测最小等位频率(minor allele frequency, MAF)大于10%的SNPs, MAF过小一般则视为假阳性,但事实上罕见SNPs(MAF<1%或MAF<5%)或者它们之间的交互作用也可能有较强的遗传效应,因此GWAS很难发现低MAF的SNPs,而全基因组测序或高通量重测序(resequencing)则有望解决这一问题。

展望

随着遗传学新技术的发展,在过去的短短3年间GWAS发现了一些CAD/MI的易感位点,这些易感位点的发现在某种程度上由助于认识CAD/MI的分子机制,但GWAS也有其局限性,因此,在后基因组时代,除了发现更多的易感位点之外,GWAS还要结合高通量测序技术、基因功能研究和蛋白质组学等研究策略,以期阐明CAD/MI这一复杂性疾病的内在分子机制。

参考文献

[1] Lopez, A., Mathers, C., Ezzati, M., Jamison, D. & Murray, C. Global and regional burden of disease and risk factors, 2001: systematic analysis of population health data. The Lancet 367, 1747-1757 (2006).

[2] Sing, C., Stengard, J. & Kardia, S. Genes, environment, and cardiovascular disease. Arteriosclerosis, thrombosis, and vascular biology 23, 1190 (2003).

[3] Wang, Q. Molecular genetics of coronary artery disease. Current opinion in cardiology 20, 182 (2005).

[4] Broeckel, U. et al. A comprehensive linkage analysis for myocardial infarction and its related risk factors. Nature genetics 30, 210-214 (2002).

[5]Hindorff LA, Sethupathy P, Junkins HA, et al. Potential etiologic and functional imp lications of genome2wide association loci for human diseases and traits. Proc NatlAcad Sci, 2009, 106∶9362~9367.

[6] Hindorff LA, Junkins HA, Mehta JP, et al. A catalog of published genome2wide association studies. Available at http: / /www. genome. gov/26525384 ( accessed, 18 Sep tember2009).

[7] Helgadottir A, Thorleifsson G, Manolescu A, Gretarsdottir S, Blondal T, et al. 2007. A common variant on chromosome 9p21 affects the risk of myocardial infarction. Science 316:1491–93

[8] McPherson R, Pertsemlidis A, Kavaslar N, Stewart A, Roberts R, et al. 2007. A common allele on chromosome 9 associated with coronary heart disease. Science 316:1488–91

[9] Samani NJ, Erdmann J, Hall AS, Hengstenberg C, Mangino M, et al. 2007. Genomewide association analysis of coronary artery disease. N. Engl. J. Med. 357:443–53

[10] Myocardial Infarction Genetics Consortium, Kathiresan S, Voight BF, Purcell S, Musunuru K, et al. 2009. Genome-wide association of early-onset myocardial infarction with single nucleotide polymorphisms and copy number variants. Nat. Genet. 41:334–41

[11] Erdmann J, Grosshennig A, Braund PS, Konig IR, Hengstenberg C, et al. 2009. New susceptibility locus for coronary artery disease on chromosome 3q22.3. Nat. Genet. 41:280–82

[12] Gudbjartsson DF, Bjornsdottir US, Halapi E, Helgadottir A, Sulem P, et al. 2009. Sequence variants affecting eosinophil numbers associate with asthma and myocardial infarction. Nat. Genet. 41:342–47

[13] Clarke R, Peden JF, Hopewell JC, Kyriakou T, Goel A, et al. 2009. Genetic variants associated with Lp(a) lipoprotein level and coronary disease. N. Engl. J. Med. 361:2518–28

[14]Luke MM, Kane JP, Liu DM, Rowland CM, Shiffman D, et al. 2007. A polymorphism in the protease-like domain of apolipoprotein(a) is associated with severe coronary artery disease. Arterioscler. Thromb. Vasc. Biol. 27:2030–36

[15]Shen GQ, Rao S, Martinelli N, et al. Association between four S, , NPs on chromosome9p21 and myocardial infarction is replicated in an Italian population. J Hum Genet, 2008, 53 (2): 144-150

[16]Shen GQ, Li L, Rao S, et al. Four SNPs on chromosome 9p21 in a South Korean population implicate a genetic locus that confers high cross-race risk for development of coronary artery disease. Arterioscler Thromb Vasc Biol,2008, 28 (2): 360-365

[17] Kiran Musunuru1,, Alanna Strong, Maria Frank-Kamenetsky, et al. From noncoding variant to phenotype via SORT1 at the 1p13 cholesterol locus. Nature Genetics, 2010, vol 466, 714-719.

通讯作者:王擎   e-mail: qkwang@mail.hust.edu.cn


    2010/9/19 14:18:58     访问数:2296
    转载请注明:内容转载自365医学网

大家都在说       发表留言

2010/9/25 16:48:42
吴奇志:学习了
2010/9/19 22:45:59
吴奇志:拜读了
2010/9/19 20:10:27
刘进民:拜读、增知
客服中心 4000680365  service@365yixue.com
编辑部   editor@365yixue.com

365医学网 版权所有 © 365heart All Rights Reserved.

京ICP备12009013号-1
京卫网审[2013]第0056号
京公网安备110106006462号
京ICP证041347号
互联网药品信息服务资格证书(京)-经营性-2018-0016  
搜专家
搜医院
搜会议
搜资源
 
先点击
再选择添加到主屏