Dolovanie údajov štúdie gwa a nezávislá replikácia identifikujú kardiomyopatiu spojenú 5 (cmya5) ako rizikový gén pre schizofréniu | molekulárna psychiatria

Dolovanie údajov štúdie gwa a nezávislá replikácia identifikujú kardiomyopatiu spojenú 5 (cmya5) ako rizikový gén pre schizofréniu | molekulárna psychiatria

Anonim

predmety

  • Asociačné štúdie týkajúce sa celého genómu
  • Rizikové faktory
  • schizofrénie

abstraktné

Vykonali sme analýzy dolovania údajov pomocou klinických antipsychotických pokusov o intervenčnú účinnosť (CATIE) a molekulárnej genetiky asociačnej štúdie genómu schizofrénie podporovanej informačnými sieťami o genetickej asociácii (MGS-GAIN) schizofrénie a vykonali sme bioinformatické stanovenie priorít pre všetky markery. s hodnotami P  0, 05 v oboch súboroch údajov. V tomto procese sme zistili, že v géne CMYA5 boli dva nesynonymné markery, rs3828611 a rs10043986, ktoré vykazovali nominálny význam vo vzorkách CATIE a MGS-GAIN. V kombinovanej analýze vzoriek CATIE a MGS-GAIN bol rs4704591 identifikovaný ako najvýznamnejší marker v géne. Analýzy spojovacej nerovnováhy ukázali, že tieto markery boli v nízkej LD (3 828 611 – rs10043986, r2 = 0, 008; rs10043986 – rs4704591, r2 = 0, 204). Okrem toho sa uvádza, že CMYA5 fyzicky interaguje s génom DTNBP1 , sľubným kandidátom na schizofréniu, čo naznačuje, že CMYA5 sa môže podieľať na rovnakej biologickej ceste a procese. Na základe týchto informácií sme uskutočnili replikačné štúdie pre tieto tri jednonukleotidové polymorfizmy. Zistilo sa, že rs3828611 má v našich írskych vzorkách protichodné výsledky a bol bez ďalšieho vyšetrovania vyradený. Ostatné dva markery sa overili v 23 ďalších nezávislých súboroch údajov. V metaanalýze všetkých 23 replikačných vzoriek (rodinné vzorky, 912 rodín s 4160 jedincami; kontrolné vzorky z prípadu, 11 380 prípadov a 15 021 kontrol) sme zistili, že oba markery sú signifikantne spojené so schizofréniou (rs10043986, pomer šancí ( OR) = 1, 11, 95% interval spoľahlivosti (CI) = 1, 04–1, 18, P = 8, 2 x 10 -4 a rs4704591, OR = 1, 07, 95% CI = 1, 03–1, 11, P = 3, 0 x 10-4 ). Výsledky boli tiež významné pre 22 kaukazských replikačných vzoriek (rs10043986, OR = 1, 11, 95% CI = 1, 03 - 1, 17, P = 0, 0026 a rs4704591, OR = 1, 07, 95% CI = 1, 02 - 1, 11, P = 0, 0015). Ďalej, analýzy podmienené haplotypmi naznačujú, že asociačné signály pozorované na týchto dvoch markeroch sú nezávislé. Na základe týchto výsledkov sme dospeli k záveru, že CMYA5 je spojený so schizofréniou a je potrebné ďalšie skúmanie génu.

úvod

Schizofrénia je psychiatrická porucha s celosvetovou prevalenciou 1%. Vyznačuje sa klammi, halucináciami a deficitmi kognície a emócie. K dispozícii sú dostatočné údaje z rodinných a dvojčlenných štúdií, ktoré naznačujú, že genetické faktory majú významné funkcie v etiológii choroby. V posledných rokoch veľké množstvo štúdií genetickej asociácie identifikovalo veľa kandidátnych génov pre túto chorobu; väčšina z týchto génov však nemá uspokojivé replikácie. Najnovšie bolo hlásených niekoľko asociácií týkajúcich sa celého genómu (GWA). 1, 2, 3, 4, 5, 6 Z mnohých potenciálnych potenciálov objavených týmito štúdiami je najkonzistentnejším nálezom široká oblasť chromozómu 6p. 2, 3, 4 Iný gén, ZNF804A , dosiahol globálny význam, keď sa kombinovali vzorky zo schizofrénie a bipolárnej poruchy. 6 Iné gény, aj keď nedosahujú význam celého genómu v počiatočných vzorkách, majú konzistentné replikácie s mnohými nezávislými vzorkami. 7, 8

Tieto nedávne GWA štúdie schizofrénie sú nielen sľubné, ale tiež ilustrujú ich obmedzenia pri detekcii jednotlivých kandidátnych génov s malými účinkami na riziko ochorenia. Potrebné sú aj alternatívne prístupy. V tejto štúdii sme implementovali metódu, ktorá kombinuje získavanie údajov z GWA dátových súborov a bioinformatickú prioritizáciu na výber sľubných kandidátskych génov a nasleduje overenie a metaanalýzy veľkého počtu nezávislých súborov údajov. Konkrétne sme vykonali GWA analýzy klinických antipsychotických pokusov o intervenčnú účinnosť (CATIE) a molekulárnej genetiky schizofrénie GWA štúdie podporovanej genetickou asociačnou informačnou sieťou (MGS-GAIN) a vybrali sme všetky kandidátne jednojadrové polymorfizmy (SNP) s P - hodnoty .050, 05 v súboroch údajov CATIE aj MGS-GAIN. Tieto markery sa potom analyzovali pomocou komplexných bioinformatických postupov stanovovania priorít. Najlepší kandidáti vychádzajúci z týchto analýz boli ďalej overení nezávislými vzorkami. Pomocou tohto prístupu sme analyzovali 25 nezávislých vzoriek s celkom viac ako 33 000 jedincami a identifikovali sme dva SNP, vrátane nesynonymného SNP, v géne CMYA5 a okolo neho, aby sa významne asociovali so schizofréniou. Tu uvádzame výsledky tejto štúdie.

Materiály a metódy

Predmety a genotypizácia

V tejto štúdii sme použili 25 vzoriek s celkom 33 834 jedincami, z toho 912 rodín so 4160 jedincami, 13 038 prípadov a 16 636 kontrol (z nich boli vylúčené prekrývajúce sa subjekty medzi CATIE a MGS-GAIN a MGS non-GAIN) čísla). Vzorky CATIE a MGS-GAIN sa použili ako naše vzorky na získavanie údajov a vytváranie hypotéz v prvej fáze našej dvojstupňovej štúdie. Zvyšných 23 vzoriek sa použilo ako replikačné vzorky. Dvadsaťštyri z 25 vzoriek bolo z kaukazského pôvodu, jedna vzorka, MGS-GAIN-AA, pochádzala z afrického amerického pôvodu. Z týchto vzoriek bolo 20 vzoriek použitých v štúdiách GWA podľa jednotlivých skupín a subjekty v týchto vzorkách boli typizované metódou Affymetrix alebo Illumina microarray. Metódou TaqMan bolo napísaných päť vzoriek, írska rodina (IFAM), írska kontrola prípadov (ICC), Bonn, Pittsburgh a Ashkenazi. 9 Kvalita genotypovania bola hodnotená jednotlivými skupinami ako uspokojivá. V tabuľke 1 boli uvedení hlavní vyšetrovatelia, veľkosť vzorky a metóda genotypizácie.

Tabuľka v plnej veľkosti

Získavanie údajov a stanovenie bioinformatických priorít

Na vykonanie analýz GWA sme použili program PLINK 10 . Analýzy GWA sa vykonali s markermi filtrovanými na kontrolu kvality z úložísk NIMH (//nimhgenetics.org/) a GAIN (//www.ncbi.nlm.nih.gov/sites/entrez?Db=gap) pre CATIE. respektíve vzorky MGS-GAIN. V týchto analýzach sa používali iba kaukazské subjekty (CATIE, 492 prípadov a 523 kontrol; MGS-GAIN, 1166 prípadov a 1368 kontrol vrátane 236 prekrývajúcich sa kontrol medzi týmito dvoma vzorkami) a markery s menšou frekvenciou aliel <1% alebo Hardy - Winbergova rovnovážna hodnota P <0, 0001 bola vylúčená. Pre súbor údajov CATIE bolo použitých sedem základných komponentov identifikovaných v predchádzajúcej štúdii 1 ako kovariáty a analyzovalo sa celkom 446 225 markerov. Vo vzorke MGS-GAIN sa na základe predchádzajúcich analýz, že vo vzorke sa nezistila žiadna významná stratifikácia, nepoužili žiadne kovariáty. Počet markerov analyzovaných pre MGS GAIN bol 727 905. Upozorňujeme, že v čase analýz GWA sme nevedeli, že medzi vzorkami CATIE a MGS-GAIN boli nejaké prekrývajúce sa subjekty; preto dve vzorky použité pri získavaní údajov a bioinformatickom stanovovaní priorít neboli úplne nezávislé. V následných analýzach spoločných markerov medzi týmito dvoma súbormi údajov bolo vylúčených 236 prekrývajúcich sa jedincov.

Na účely bioinformatického určovania priorít sme najskôr vybrali všetky markery s hodnotami P  0, 05 v dvoch súboroch údajov a porovnali ich proti sebe. Po párovaní bolo vo vzorkách CATIE aj GAIN 1128 SNP s neupravenými P- hodnotami 0, 05, 0. Potom sme uskutočnili bioinformatickú prioritizáciu týchto 1128 SNP na základe toho, či sú lokalizované v evolučne konzervovaných regiónoch, génových oblastiach (exóny, intróny, netranslatované oblasti alebo do 2 kb génu), väzobných miestach pre transkripčný faktor alebo či sú ktoré sa nachádzajú v známych kandidátnych génoch schizofrénie (uvedené v sczgénovej databáze //www.schizophreniaforum.org/res/sczgene/default.asp do júna 2008) alebo či SNP nie sú synonymné. SNP v každej z týchto kategórií bolo pridelené empirické skóre: 2 pre nesynonymné a známe kategórie kandidátnych génov schizofrénie, 1 pre evolučne konzervovanú oblasť, väzbové miesto pre transkripčný faktor, nepreloženú oblasť a synonymnú kategóriu SNP a 0, 5 pre „v rámci“ 2 kb génovej kategórie. Nakoniec boli SNP zoradené podľa súčtu bodov. 11

Keď bol gén CMYA5 identifikovaný ako vedúci kandidát, uskutočnili sme analýzu LD génu génu pomocou programu HAPLOVIEW. 12 Extrahovali sme všetky markery v géne plus 20 kb proti smeru a proti smeru sekvencie pre vzorky CATIE a MGS-GAIN a vybrali sme spoločné markery medzi týmito dvoma súbormi údajov. Dáta z týchto dvoch súborov údajov boli kombinované. Asociačná analýza kombinovaných vzoriek sa uskutočňovala aj pomocou programu UNPHASED. 13

Replikácia a metaanalýzy nezávislých vzoriek

Na základe stanovenia priorít sme v našich vzorkách IFAM a ICC iniciovali genotypizáciu troch SNP, rs3828611, rs10043986 a rs4704591. Pokiaľ ide o rs10043986 a rs4704591, výsledky z našich írskych vzoriek boli v súlade s výsledkami pozorovanými v súboroch údajov CATIE a MGS-GAIN. Rs3828611 mala medzi našimi írskymi vzorkami nejednotné výsledky; preto bol bez ďalšieho vyšetrovania zrušený. Na overenie asociácie pozorovanej pre rs10043986 a rs4704591 sme požiadali o genotypizáciu dvoch ďalších vzoriek (Bonn a Pittsburgh) a vyžiadané údaje zo štúdií GWA z 21 nezávislých vzoriek (pozri tabuľku 1). Vzorka MGS-non-GAIN mala tiež 208 prekrývajúcich sa kontrolných subjektov so súborom údajov CATIE. Aby sa zachovala nezávislosť medzi vzorkami použitými v replikačnej štúdii, boli tieto prekrývajúce sa subjekty odstránené zo vzorky MGS-non-GAIN.

Uskutočnili sa metaanalýzy iba pre všetky vzorky a replikačné vzorky. Vytvorili sme kombinované pravdepodobnostné pomery (OR) rodinných a prípadových kontrolných vzoriek pomocou informácií obsiahnutých v primárnych analýzach a štandardných metaanalytických technikách. Pre vzorku IFAM sme na vytvorenie OR použili prístup podobný PDT. 14 Štatistika PDT porovnáva počet prenosov danej rodičovskej alely („rizikovej“ alely) v porovnaní s neprenášanými a skúma zdieľanie alel medzi postihnutými a neovplyvnenými súrodeneckými pármi, zatiaľ čo štandardné prístupy typu case-control skúmajú frekvencie alel v prípadoch verzus kontroly. Rodičovský prenos ALEBO je skonštruovaný ako (a / c) / (b / d), kde a je prenos vysokorizikovej alely, c je neprenos vysokorizikovej alely, b je prenos všetkých ďalšie alely ad je neprenos všetkých alel. Vo vzorke súrodeneckých párov a vo vzorkách založených na populácii, ktoré porovnávajú prípad na reguláciu frekvencií alel, skonštruujeme OR ako (a / c) / (b / d), kde a je počet hlavných alel prítomných v prípadoch, c je počet menších alel prítomných v prípadoch, b je počet hlavných alel v kontrolách a d je počet menších alel prítomných v kontrolách. V každej z kontrolných vzoriek EA vytvoríme OR ako (a / c) / (b / d), kde a je počet hlavných alel prítomných v prípadoch, c je počet menších alel prítomných v prípadoch, b je počet hlavných alel v kontrolách ad je počet menších alel prítomných v kontrolách. Vo vzorke AA sme použili logistický regresný model zahŕňajúci prvú hlavnú zložku stratifikácie populácie ako kovariát. Regresný koeficient účinku SNP nám umožnil odhadnúť OR a rozptyl na zahrnutie do metaanalýzy.

Použili sme formálne metaanalytické techniky na kombináciu NR medzi typmi štúdií. Pri metaanalýze sme vykonali prístup s pevným efektom (Mantel – Haenszel). Pred združením sme vykonali Cochranov ( Q ) x 2 test heterogenity, aby sme sa uistili, že každá skupina štúdií bola vhodná na metaanalýzu. Vo všeobecnosti sa pri metaanalýze, keď sa zistí významná heterogenita, štúdie považujú za nevhodné na združovanie prostredníctvom prístupu s pevnými účinkami. V súhrnnej metaanalýze všetkých štúdií, vrátane vzoriek na odhaľovanie a replikáciu, došlo k známemu prekrývaniu kontrol medzi vzorkami MGS-GAIN a CATIE. Vypočítali sme asymptotickú koreláciu medzi Z- hodnotami týchto dvoch štúdií a vykonali sme metaanalýzu založenú na Z -skóre korigujúcu koreláciu kvôli zdieľaným kontrolám, aby sa zabezpečila primeraná miera chybovosti typu I. 16

Testovanie nezávislého účinku medzi rs10043986 a rs4704951

Pretože existujú dva SNP, ktoré vykazujú asociáciu v géne CMYA5 , hodnotili sme, či asociačné signály pozorované pri rs10043986 a rs4704591 boli štatisticky nezávislé. Použili sme prístup implementovaný v programe PLINK 17, ktorý porovnáva riziko haplotypov s identickými alelami v lokuse na pozadí, ale s rôznymi alelami v lokuse, ktorý sa má hodnotiť. V tomto prípade sme odvodili všetky štyri haplotypy pre rs10043986 – rs4704591 a testovali sme účinky haplotypov s rovnakou alelou na rs4704591, ale rôzne alely na rs10043986. Naším cieľom bolo vyhodnotiť, či je účinok rs10043986 nezávislý od rs4704591. Na vykonávanie tejto analýzy používame program UNPHASED 13, pretože na rozdiel od PLINK je schopný kombinovať údaje o rodine a dáta prípadu pre také analýzy založené na haplotypoch.

výsledok

Spoločnosť GWA študuje získavanie údajov a stanovenie bioinformatických priorít

Z analýz GWA dátových súborov CATIE a MGS-GAIN bolo 24 160 a 68 371 markerov s neupravenými hodnotami P .05 0, 05. Aj keď žiadny z markerov v CATIE a MGS-GAIN nedosiahol významnosť pre celý genóm, počet markerov dosahujúcich nominálny význam (to je 68 371) bol významne väčší, ako sa očakávalo (to je 37 725) vo vzorke MGS-GAIN, čo naznačuje, že v tejto skupine nominálne významných markerov boli markery so skutočnými účinkami. Z týchto markerov bolo 1228 markerov s P = 0, 05 v oboch súboroch údajov (doplnková tabuľka SI). Tieto markery predstavovali skupinu, ktorú sme použili na ďalšie bioinformatické stanovenie priorít. Z týchto markerov informačné postupy odhalili niekoľko najlepších kandidátnych génov (tabuľka 2). Z týchto najlepších kandidátov mali CMYA5 a PTPN21 dva nesynonymné SNP. Pretože dva nesynonymné markery v CMYA5 , rs3828611 a rs10043986, mali odlišné frekvencie a boli umiestnené v dvoch rôznych exónoch génu, mysleli sme si, že môžu predstavovať nezávislé asociačné signály. Naopak, tieto dva markery v géne PTPN21 mali veľmi podobnú frekvenciu. Preto sme sa rozhodli zamerať sa na gén CMYA5 . Existovali ďalšie gény, ktoré mali viac markerov s rôznymi frekvenciami (tabuľka 2). Patria sem LRP1B , COLQ , SERINC1 , PTPN21 , EML5 , NTRK3 a NUTF2 . Na overenie ich funkcií pri schizofrénii môžu byť potrebné ďalšie analýzy týchto génov.

Tabuľka v plnej veľkosti

Vykonali sme vyhľadávanie literatúry pre gén CMYA5 a zistili sme, že sa uvádza, že fyzicky interaguje s DTNBP1 , hlavným kandidátom na schizofréniu, ktorý bol prvýkrát uvedený v našej vzorke 18 IFAM zahrnutej v tejto štúdii. Analyzovali sme tiež asociáciu jednotlivých markerov pre zdieľané SNP medzi CATIE a MGS-GAIN v tomto intervale kombináciou vzoriek CATIE a MGS-GAIN. Tieto analýzy identifikovali najvýznamnejší marker, rs4704591, ktorý je umiestnený asi 9 kb po prúde od génu. Všimnite si, že v čase našich analýz GWA sme si neuvedomili, že medzi štúdiami CATIE a MGS-GAIN sa prekrývali subjekty. Po odstránení prekrývajúcich sa subjektov medzi súbormi údajov CATIE a MGS-GAIN sa uskutočnila analýza kombinovaných vzoriek. Hodnoty P pre tieto tri markery boli 0, 0078 (OR = 1, 31, 95% interval spoľahlivosti (CI) = 1, 07-1, 60); 0, 0050 (OR; 1, 19, 95% CI = 1, 06 - 1, 30) a 0, 00032 (OR = 1, 17, 95% CI = 1, 08 - 1, 24) pre rs3828611, rs10043986 a rs4704591 (obrázok la). LD analýzy 27 spoločných markerov zdieľaných štúdiami CATIE a MGS-GAIN sa uskutočňovali s použitím programu HAPLOVIEW 12 pre gén a hraničných sekvencií 20 kb (obrázok 1b). LD medzi rs3828611 a rs10043986 bola 0, 008 (r2), LD medzi rs10043986 a rs4704591 bola 0, 208 (r2) a LD medzi rs3828611 a rs4704591 bola 0, 016 (r2). Pretože LD medzi týmito tromi markermi boli relatívne nízke, bolo pravdepodobné, že predstavovali rôzne asociačné signály. Existovali dva ďalšie markery vykazujúce podobnú úroveň asociácie ako rs3828611. Rs6880680 bol vo vysokej LD s rs3828611 (r2 = 0, 713), jeho účinok nemusí byť nezávislý. Rs6870619 bol v nízkej LD so všetkými ostatnými markermi v tejto oblasti. Keďže však jeho signál nebol taký silný ako rs4704591 a nedosiahol nominálny význam vo vzorke CATIE, nevykonával sa.

Image

a ) Asociačná analýza kombinovaných vzoriek. Značky vybrané na replikáciu boli zvýraznené. b ) LD štruktúra 27 markerov napísaných vo vzorkách CATIE a MGS-GAIN. Boli ukázané párové hodnoty LD ( r2 ). Tri študované markery boli v nízkej LD, čo naznačuje, že pozorované asociačné signály sa môžu u týchto markerov líšiť.

Obrázok v plnej veľkosti

  • Stiahnite si snímku aplikácie PowerPoint

Overovanie združenia CMYA5 v írskych vzorkách

Na základe dolovania údajov a bioinformatického určovania priorít sme začali potvrdzujúcu štúdiu pomocou našich vzoriek IFAM a ICC pre tieto tri SNP (rs3828611, rs10043986 a rs4704591). Použili sme program UNPHASED 13, ktorý bol navrhnutý na kombináciu prípadov a kontrolných vzoriek a na analýzu našich kombinovaných vzoriek. Výsledky našich írskych vzoriek podporujú združenie rs10043986 a rs4704951. Pokiaľ ide o rs10043986, vzorky z prípadu aj z kontroly rodiny vykazovali rovnaký smer asociácie pre rovnakú alelu ako v súboroch údajov CATIE a MGS-GAIN. Ani jednotlivé vzorky (prípadové a rodinné vzorky) ani kombinované vzorky však nedosiahli významnosť. V prípade rs4704591 mala vzorka prípadu-kontrola hodnotu P 0, 2066 a vzorka rodiny mala hodnotu P 0, 0083. Spojené vzorky prípadu - kontroly a rodiny mali hodnotu P 0, 0041. Spojenie rs3828611 bolo v opačných smeroch medzi našimi ICC a vzorkami rodiny (údaje nie sú uvedené). V dôsledku týchto konfliktných výsledkov bola rs3828611 bez ďalšieho vyšetrovania zrušená.

Meta-analýza rs10043986 a rs4704591

Výsledky zo vzoriek ICC a rodín boli povzbudivé. Na ďalšie potvrdenie sme vyžiadali údaje a replikáciu od 23 nezávislých vzoriek pre rs10043986 a rs4704591. Informácie o všetkých vzorkách sú zhrnuté v tabuľke 1 vrátane údajov CATIE a MGS-GAIN použitých v našom procese získavania údajov. Celkovo sme mali celkovú veľkosť vzorky 33 834 jedincov, z toho 912 rodín so 4160 jedincami, 13 038 prípadov a 16 636 kontrol (z týchto čísel boli vylúčené prekrývajúce sa subjekty). Genotypizácia sa uskutočňovala jednotlivými skupinami pomocou rôznych techník (pozri tabuľku 1). Na zabezpečenie kvality sme skúmali grafy intenzity týchto dvoch markerov. Potom sa uskutočnili metaanalýzy. Pre rodinné vzorky sa použili počty pre prenesené a neprenesené alely. Pre vzorky z prípadu sa použili počty alel pre prípady a kontroly. V metaanalýze všetkých 23 replikačných vzoriek (rodinné vzorky, 912 rodín so 4160 jedincami; kontrolné vzorky od prípadu, 11 380 prípadov a 15 021 kontrol) sme zistili, že oba markery sú signifikantne spojené so schizofréniou (rs10043986, OR = 1, 11). 95% CI = 1, 04 - 1, 18, P = 8, 2 x 10-4 a rs4704591, OR = 1, 07, 95% CI = 1, 03 - 1, 11, P = 3, 0 x 10-4 ; tabuľka 3). Medzi vzorkami nebola žiadna významná heterogenita (test heterogenity: rs10043986, Q = 13, 88, df = 16, P = 0, 61; rs4704591, Q = 17, 15, df = 19, P = 0, 58). Výsledky boli tiež významné pre 22 kaukazských replikačných vzoriek (rs10043986, OR = 1, 11, 95% CI = 1, 03 - 1, 17, P = 0, 0026; rs4704591, OR = 1, 07, 95% CI = 1, 02 - 1, 11, P = 0, 0015). Výsledky kombinovanej vzorky vrátane CATIE a MGS GAIN a započítania prekrývania poskytujú kombinovanú hodnotu P pre rs4704591 1, 11 × 10 −5 ( Z = 4, 39) a pre rs10043986 1, 47 × 10 −5 ( Z = 4, 33).

Tabuľka v plnej veľkosti

rs10043986 a rs4704591 sú nezávisle asociované so schizofréniou

Ako sme si všimli, že dva SNP v géne CMYA5 sú významne asociované so schizofréniou, snažili sme sa vyhodnotiť, či sú tieto dva asociačné signály nezávislé. V súboroch dolovania údajov bola LD medzi týmito dvoma SNP relatívne nízka (r2 = 0, 208) a podobné výsledky sa získali v našich kombinovaných európskych vzorkách (r2 = 0, 212), vrátane vzoriek MGS-GAIN a CATIE. Aby sme otestovali, či je účinok rs10043986 nezávislý od účinku rs4704591, odvodili sme haplotypy z týchto dvoch markerov pre kombinované európske vzorky a vyhodnotili sme, či tieto haplotypy zdieľajúce identické alely v rs4704591, ale rôzne alely v rs10043986, majú rôzne riziko ochorenia. Ak tieto haplotypy majú výrazne odlišné riziká, účinky týchto dvoch markerov by boli aspoň čiastočne nezávislé. Tabuľka 4 sumarizuje naše výsledky. Z tabuľky bolo zrejmé, že haplotypy zdieľajúce rovnaké pozadie aliel v lokusoch rs4704591, to znamená CC verzus TC a CG verzus TG, vykazujú výrazne odlišné riziká pre túto chorobu. Inými slovami, rs10043986 mal účinok nezávislý od rs4704591. Analýzy sme skontrolovali aj pomocou programu PLINK pomocou všetkých európskych vzoriek prípadovej kontroly, pretože spoločnosť PLINK nemohla pri takejto analýze kombinovať rodinné údaje s údajmi prípadovej kontroly. V tejto analýze sme skontrolovali nezávislý účinok rs10043986 porovnaním haplotypov zdieľajúcich rovnaké alely v rs4704591 a výsledok bol významný (OR = 1, 07, P = 0, 0006).

Tabuľka v plnej veľkosti

diskusia

V posledných rokoch štúdie GWA identifikovali sľubných kandidátov na celý rad komplexných porúch, ako je diabetes 2. typu, 19, 20, 21 rakovina pľúc, 22, 23, 24 Parkinsonova choroba, 25, 26 reumatoidná artritída 27 a systémový lupus erythematodes. Výsledky schizofrénie boli vo všeobecnosti menej úspešné. Okrem širokého regiónu v oblastiach 6p a TCF4 a NRGN , 4 individuálne štúdie GWA ešte nepriniesli kandidátov, ktorí by dosiahli celoštátny význam. Z mnohých možných faktorov vedúcich k výsledkom môžu byť dôležitými faktormi nedostatočná sila v týchto jednotlivých štúdiách a potreba korekcie pre veľký počet testovaných markerov. Avšak ako súhrnné analýzy naznačili, že medzi tými markermi, ktoré prechádzajú nominálnym významom, môžu existovať skutočné nálezy 3, veríme, že toto je jeden z najdôležitejších prínosov štúdií GWA. Vzhľadom na skutočnosť, že vo veľkom počte testovaných markerov sú pochované markery / gény so skutočnými účinkami, je praktické identifikovať tieto markery so skutočnými účinkami. V tejto štúdii sme prispôsobili dvojstupňový prístup, čo viedlo k identifikácii dvoch markerov v géne CMYA5 . V prvej fáze generovania hypotéz sme vykonali analýzy GWA pre dva verejne dostupné súbory údajov, súbory údajov CATIE a MGS-GAIN a vybrané a hodnotené markery podľa štatistických a bioinformatických postupov. Tieto postupy kombinovali štatistické a biologické hodnotenia markerov s dôrazom na relevantnosť potenciálnych funkcií pri chorobe. V tejto štúdii zistenie dvoch nesynonymných markerov v géne CMYA5 dosahujúcich nominálny význam a nízkej LD medzi týmito markermi malo dôležitú funkciu pri výbere génu pre ďalšie overenie a replikáciu. Zverejnená priama interakcia medzi CMYA5 a DTNBP1 , 29 vedúcim kandidátnym génom pre schizofréniu, naznačovala, že tieto gény sa môžu podieľať na spoločnej ceste alebo biologickom procese. Táto informácia presunula gén CMYA5 na začiatok nášho rebríčka. V druhej fáze sa celkovo 23 nezávislých súborov údajov použilo na vyhodnotenie významu týchto markerov štandardnými metaanalýzami. S týmito prístupmi sme dokázali zistiť, že oba markery v géne sú významne asociované so schizofréniou a že vo vzorkách použitých v tejto štúdii, vrátane vzorky MGS-GAIN-AA, neexistuje žiadna heterogenita. Okrem toho asociačné signály pozorované v týchto dvoch markeroch sú nezávislé. Pretože sme v tejto štúdii použili dvojfázový dizajn, výsledky by sa mali vyhodnotiť podľa počtu markerov testovaných v druhej etape, napriek tomu, že sme v našej fáze objavovania vyťažili dva súbory údajov GWA. Na základe tohto kritéria a vzhľadom na veľký počet nezávislých vzoriek a kombinovanú veľkosť vzorky sú naše výsledky významné. Je dôležité, že jeden z našich markerov môže mať priame funkčné dôsledky, pretože mení 4063. aminokyselinu proteínu z prolínu na leucín, čo by malo za následok zmenu veľkosti zvyšku a hydrofóbnosti na C-konci proteínu, čo je oblasť, ktorá bola hlásená na interakciu s podjednotkou regulátora proteínkinázy. 30 Funkcia tohto nesynonymného SNP poskytuje príležitosť priamo otestovať jeho účinok v biológii schizofrénie.

Našou motiváciou pre túto štúdiu bolo nájsť spôsob, ako znížiť pokutu uloženú GWA a umožniť nám identifikovať markery so skutočnými účinkami, ale nie nevyhnutne dosiahnuť konvenčné úrovne celoštátneho významu. Štúdia GWA je skvelý nástroj. Jeho systematický prístup bez hypotéz je objektívny a má veľký potenciál. Na dosiahnutie tohto cieľa je však potrebná dostatočná sila a / alebo homogenita vzorky na kompenzáciu strmého trestu, ktorý sa musí zaplatiť za testovanie stoviek tisíc značiek. Toto vytvára situáciu, v ktorej môže mať veľa markerov skutočné asociácie, ale nedosahujú štandardy GWA. Na základe tohto odôvodnenia sme využili prístup opísaný v tejto štúdii, ktorý viedol k identifikácii génu CMYA5 ako kandidáta na schizofréniu.

Pri spätnom pohľade sa mohlo zlepšiť niekoľko aspektov tohto prístupu. Najprv sme nezohľadnili rozdiely vo veľkosti a sile vzoriek medzi štúdiami MGS-GAIN a CATIE a použili sme rovnaké medzné hodnoty ( P = 0, 05) pre obe vzorky. Po druhé, pri porovnávaní značiek vybraných z týchto dvoch súborov údajov sme nezohľadnili znak (smer) asociácie. Objektívnejším prístupom by mohlo byť vykonanie formálnej metaanalýzy vybraných markerov pre tieto dva súbory údajov a pri stanovení klasifikácie markerov zohľadniť hodnoty P metaanalýzy. Po tretie, v našej bioinformatickej priorite sme sa zamerali na jednotlivé markery SNP. Tieto vlastnosti by sme mohli rozšíriť na markery vo vysokej LD, vrátane imputácie netypovaných markerov v blízkom okolí. Po štvrté, v prípade génu alebo oblasti, ktorá mala s týmto ochorením spojené viac markerov, mohla byť vykonaná analýza haplotypov a testovanie nezávislých účinkov, aby sa vybrali najlepšie a nezávislé markery na overenie.

Naša štúdia poskytuje príklad, že v štúdiách GWA existujú markery so skutočnými účinkami a vzhľadom na dostatočne veľkú veľkosť vzorky možno tieto markery identifikovať. V tejto štúdii boli pozorované OR pre rs10043986 a rs4704591 1, 11, respektíve 1, 07, porovnateľné s výsledkami pozorovanými v géne ZNF804A . 6 Pre gén CMYA5 môžu existovať ďalšie asociačné signály. Rs3828611 je ďalší nesynonymný marker vybraný našimi postupmi získavania údajov, ktorý má nízku LD s rs10043986 a rs4704591. Po konfliktných výsledkoch z našich vzoriek ICC a rodín sme o to ďalej nepokračovali. Pri spätnom pohľade môže byť naše ukončenie rs3828611 predčasné.

Gén CMYA5 , tiež známy ako myospryn, bol prvýkrát identifikovaný ako gén spojený s kardiomyopatiou. 31 Gén je vysoko exprimovaný v kostrových svaloch a srdci a je mierne exprimovaný v mozgu (nepublikované údaje). Uvádza sa, že je spojený s hrúbkou steny ľavej komory u pacientov s hypertenziou. 32 Funkcia génu však zostáva neznáma. Bolo publikované, že interaguje s DTNBP1 , 29, 33, regulačnou podjednotkou proteínkinázy A30 a desminom 34 vo svalových bunkách. Interakcia s DTNBP1 , ďalším vedúcim kandidátom na schizofréniu, 35, 36, je zaujímavým vodcom . V našej írskej vzorke sa prvýkrát zistilo, že DTNBP1 je spojený so schizofréniou. 18 Následne mnohé štúdie, vrátane niekoľkých štúdií, ktoré používali vzorky 37, 38, 39, 40, 41 uvedené v tomto dokumente, poskytli podporné dôkazy pre združenie. Táto interakcia naznačuje, že CMYA5 sa môže podieľať aj na biogenéze procesov organely 1 (BLOC-1) súvisiacich s lyzozómami , o ktorých sa predpokladá, že sa podieľajú na schizofrénii. 42, 43, 44, 45 Interakcia s regulačnou podjednotkou proteínkinázy A naznačuje, že CMYA5 sa môže podieľať na regulácii signálnej dráhy cAMP, čo sa tiež podieľa na schizofrénii. 46, 47 Tieto potenciálne súvislosti naznačujú, že ďalšie štúdie môžu testovať epistatickú interakciu medzi týmito vzájomne sa ovplyvňujúcimi partnermi a skúmať ich funkcie v molekulárnych, vývojových a patofyziologických procesoch pri schizofrénii.

Stručne povedané, s použitím dvojstupňového dizajnu as jednou z najväčších veľkostí vzoriek uvádzaných v nedávnej literatúre uvádzame dôkazy, že dva SNP s relatívne nízkou LD navzájom k sebe v géne CMYA5 sú nezávisle spojené so schizofréniou. Tieto výsledky naznačujú, že v množinách údajov GWA môže byť veľa markerov, ktoré majú skutočné, ale malé účinky. Na identifikáciu týchto markerov je nevyhnutná veľká veľkosť vzorky a spolupráca v mnohých skupinách.

Doplnková informácia

Excel súbory

  1. 1.

    Doplnková tabuľka S1

prílohy

príloha

Členovia Genetického rizika a výsledku v psychóze (GROUP):

René S Kahn 1, Don H Linszen 2, Jim van Os 3, Durk Wiersma 4, Richard Bruggeman 4, Wiepke Cahn 1, Lieuwe de Haan 2, Lydia Krabbendam 3 a Inez Myin-Germeys 3

1 Psychiatrické oddelenie, Neurovedný ústav Rudolfa Magnusa, Univerzitné zdravotnícke centrum Utrecht, Postbus 85060, 3508 AB, Utrecht, Holandsko; 2 Katedra psychiatrie, Akademické lekárske centrum, Univerzita v Amsterdame, Amsterdam, NL326 Groot-Amsterdam, Holandsko; 3 Zdravotnícke stredisko Maastrichtskej univerzity, Sieť výskumu a výučby duševného zdravia v južnom Limburgu, P. Debyelaan 25, 6229 HX Maastricht, Maastricht, Holandsko; 4 Psychiatrické oddelenie, University Medical Center Groningen, University of Groningen, PO Box 30.001, 9700 RB Groningen, Holandsko.

Členovia medzinárodného konzorcia schizofrénie:

Univerzita Cardiff: Michael C O'Donovan 6, George K Kirov 6, Nick J Craddock 6, Peter A Holmans 6, Nigel M Williams 6, Ludmila Georgieva 6, Ivan Nikolov 6, N Norton 6, H Williams 6, Draga Toncheva 16, Vihra Milanova 17, Michael J Owen 6 ; Karolinska Institutet / Univerzita v Severnej Karolíne v Chapel Hill: Christina M Hultman 11, 12, Paul Lichtenstein 11, Emma F Thelander 11, Patrick Sullivan 7 ; Trinity College Dublin: Derek W Morris 9, Colm T. O'Dushlaine 9, Elaine Kenny 9, Emma M. Quinn 9, Michael Gill 9, Aiden Corvin 9 ; University College London: Andrew McQuillin 8, Khalid Choudhury 8, Susmita Datta 8, Jonathan Pimm 8, Srinivasa Thirumalai 18, Vinay Puri 8, Robert Krasucki 8, Jacob Lawrence 8, Digby Quested 19, Nicholas Bass 8, Hugh Gurling 8 ; University of Aberdeen: Caroline Crombie 15, Gillian Fraser 15, Soh Leh Kuan 14, Nicholas Walker 20, David St Clair 14 ; University of Edinburgh: Douglas HR Blackwood 10, Walter J Muir 10, Kevin A McGhee 10, Ben Pickard 10, Pat Malloy 10, Alan W Maclean 10, Margaret Van Beck 10 ; Queenslandský inštitút lekárskeho výskumu: Naomi R Wray 5, Stuart Macgregor 5, Peter M. Visscher 5 ; University of Southern California: Michele T Pato 13, Helena Medeiros 13, Frank Middleton 21, Celia Carvalho 13, Christopher Morley 21, Ayman Fanous 13, 22, 23, 24, David Conti 13, James A Knowles 13, Carlos Paz Ferreira 25, Antonio Macedo 26, M Helena Azevedo 26, Carlos N Pato 13 ; Všeobecná nemocnica v Massachusetts: Jennifer L Stone 1, 2, 3, 4, Douglas M Ruderfer 1, 2, 3, 4, Andrew N Kirby 2, 3, 4, Manuel AR Ferreira 1, 2, 3, 4, Mark J Daly 2 3, 4, Shaun M Purcell 1, 2, 3, 4, Pamela Sklar 1, 2, 3, 4 ; Stanleyovo centrum pre psychiatrický výskum a široký inštitút MIT a Harvard: Shaun M. Purcell 1, 2, 3, 4, Jennifer L Stone 1, 2, 3, 4, Kimberly Chambert 3, 4, Douglas M Ruderfer 1, 2, 3, 4, Finny Kuruvilla 4, Stacey B Gabriel 4, Kristin Ardlie 4, Jennifer L Moran 4, Mark J Daly 2, 3, 4, Edward M Scolnick 3, 4, Pamela Sklar 1, 2, 3, 4 .

1 Psychiatrická a neurodevelopmentálna genetická jednotka, 2 Centrum pre genetický výskum človeka, Massachusetts General Hospital, 185 Cambridge Street, Boston, MA 02114, USA; 3 Stanleyovo centrum pre psychiatrický výskum, Broad Institute of Harvard and MIT, Cambridge, MA 02142, USA; 4 Broad Institute of Harvard a MIT, Cambridge, MA 02142, USA; 5 Queensland Institute of Medical Research, 300 Herston Road, Brisbane, Queensland 4006, Austrália; 6 Katedra psychologického lekárstva, Centrum MRC pre neuropsychiatrickú genetiku a genomiku, Lekárska fakulta, Cardiffská univerzita, Cardiff C14 4XN, UK; 7 Katedry genetiky, psychiatrie a epidemiológie, Univerzita v Severnej Karolíne v Chapel Hill, Chapel Hill, NC 27599, USA; 8 Výskumné oddelenie vied o duševnom zdraví, Laboratórium molekulárnej psychiatrie, Lekárska fakulta University College London, Windeyer Institute of Medical Sciences, 46 Cleveland Street, LondonW1T4JF, UK; 9 Oddelenie psychiatrie a Ústav molekulárnej medicíny, Neuropsychiatrická skupina pre výskum genetiky, Trinity College Dublin, Dublin 2, Írsko; 10 Divízia psychiatrie, Univerzita Edinburgh, Kráľovská nemocnica v Edinburghu, Edinburgh EH10 5HF, UK; 11 Oddelenie lekárskej epidemiológie a biostatistiky, Karolinska Institutet, SE-171 77 Štokholm, Švédsko; 12 Oddelenie neurovedy, psychiatrie, Ulleråker, Univerzita v Uppsale, SE-750 17 Uppsala, Švédsko; 13 Centrum genomickej psychiatrie, Univerzita v južnej Kalifornii, Los Angeles, CA 90033, USA; 14 Ústav lekárskych vied, 15 Katedra duševného zdravia, University of Aberdeen, Aberdeen AB25 2ZD, UK; 16 Oddelenie lekárskej genetiky, Fakultná nemocnica Maichin Dom, Sofia 1431, Bulharsko; 17 Psychiatrické oddelenie, 1. psychiatrická klinika, Fakultná nemocnica Alexander, Sofia 1431, Bulharsko; 18 West Berkshire NHS Trust, 25 Erleigh Road, Reading RG3 5LR, UK; 19 Psychiatrická klinika, Oxfordská univerzita, Warnefordská nemocnica, Headington, Oxford OX3 7JX, UK; 20 Ravenscraig Hospital, Inverkip Road, Greenock PA16 9HA, UK; 21 State University of New York - Upstate Medical University, Syracuse, NY 13210, USA; 22 Washington VA Medical Center, Washington DC 20422, USA; 23 Psychiatrické oddelenie, Univerzita medicíny Georgetown University, Washington DC 20057, USA; 24 Katedra psychiatrie, Virginia Commonwealth University, Richmond, VA 23298, USA; 25 Katedra psychiatrie, Sao Miguel, 9500-310 Azory, Portugalsko; 26 Katedra psychiatrickej univerzity v Coimbre, 3004 - 504 Coimbra, Portugalsko.

Doplňujúce informácie sprevádzajú dokument na webovej stránke Molecular Psychiatry (//www.nature.com/mp)