Časový prenos exomátov z pôvodnej americkej populácie pred európskym kontaktom a po ňom | prírodná komunikácia

Časový prenos exomátov z pôvodnej americkej populácie pred európskym kontaktom a po ňom | prírodná komunikácia

Anonim

predmety

  • Biologická antropológia
  • Evolučná biológia
  • Genetická variácia

abstraktné

Hlavným faktorom úbytku populácie pôvodných Američanov po kontakte s Európou bol prisúdený náchylnosť na infekčné choroby. Aby sme preskúmali, či k tomuto fenoménu prispela už existujúca genetická zložka, analyzujeme 50 exomov kontinuálnej populácie zo severozápadného pobrežia Severnej Ameriky, ktorá pochádza z obdobia pred a po kontakte s Európou. Modelujeme zrútenie populácie po kontakte s Európou, čo vedie k 57% zníženiu efektívnej veľkosti populácie. Identifikujeme tiež podpisy pozitívnej selekcie na imunitne príbuzných génoch v starej, ale nie modernej skupine, pričom najsilnejší signál pochádza z génu HLA-DQA1 ľudského leukocytového antigénu (HLA). Moderní jedinci vykazujú výrazný pokles frekvencie v rovnakých alelách, pravdepodobne v dôsledku zmeny životného prostredia spojeného s európskou kolonizáciou, pričom negatívny výber mohol po kontakte pôsobiť na rovnaký gén. Zjavný posun vo výberových tlakoch koreluje s regionálnymi epidémiami prenášanými v Európe v 20. rokoch 20. storočia.

úvod

Pokles populácií domorodých Američanov po európskom kontakte súvisel s niekoľkými faktormi vrátane boja, zmien v sociálnej štruktúre a obrovského zavedenia európskych patogénov 1, 2, 3 . Aj keď miera úbytku obyvateľstva je naďalej sporná, epidémie na európskej úrovni môžu k tomuto javu neprimerane prispieť 4, 5 . Diskusia viedla vedcov k tomu, aby preskúmali možnosť genetickej citlivosti, keď nízka genetická variabilita HLA génov a imunologicky naivných populácií je spojená s exacerbovanou úmrtnosťou spojenou s patogénom 6, 7, 8 . Predpoklady homogenity medzi určitými imunitnými génmi 8 sú však založené na prieskumoch žijúcich domorodých Američanov, ktorí zastupujú pozostalých členov komunít postihnutých európskym kontaktom a kolonizáciou. Nezohľadňujú teda imunitné genetické faktory, ktoré mohli existovať pred kontaktom.

Imunologická história pôvodných obyvateľov Ameriky je nepochybne zložitá. Keď ľudia vstúpili do Amerík a expandovali do rôznych regiónov - pred 15 000 - 20 000 rokmi (BP) 9, 10, skupiny sa stretli s prostredím s rôznou ekológiou as relatívne malým tokom génov z iných kontinentálnych populácií až do európskeho kontaktu 11 . Predpokladáme, že pôvodní ľudia sa prispôsobili miestnym patogénom, čo viedlo k dlhotrvajúcim zmenám v lokusoch súvisiacich s imunitou. Predpokladá sa, že starodávne imunitné adaptácie sa vyskytli v celej ľudskej histórii, keďže populácie sa šírili do rôznych prostredí po celom svete 12 . Keby sa pôvodní obyvatelia Ameriky prispôsobili miestnym patogénom, tieto adaptácie by sa ukázali ako užitočné v staroveku, ale nie nevyhnutne po tom, ako by európski kolonialisti zmenili životné prostredie svojimi patogénmi, z ktorých niektoré mohli byť nové 13, 14, 15 . Existujúce genetické variácie v dôsledku prispôsobenia sa pred kontaktom s Európou mohli teda prispieť k poklesu pôvodného obyvateľstva po kontakte s Európou.

Aby sme preskúmali možnosť existujúcej genetickej zložky, sekvenovali sme 50 exomov starovekých a moderných jedincov zo severozápadného pobrežia Severnej Ameriky z obdobia pred a po kontakte s Európou. Potvrdzujeme genetickú kontinuitu medzi starými a modernými jedincami a časom sme vytvorili jedinú súvislú populáciu. Z nášho demografického modelu vyplýva 57% zníženie efektívnej veľkosti obyvateľstva po kontakte s Európou. Zisťujeme tiež podpisy pozitívneho výberu na imunitne príbuzných génoch u starých, ale nie u moderných jedincov. Najsilnejší selekčný signál v staroveku pochádza z génu HLA-DQA1 ľudského leukocytového antigénu (HLA), s alelami, ktoré sú blízko fixácie. Dôležitá imunitná funkcia HLA-DQA1 podporuje starodávnu adaptáciu na prostredie Ameriky. Moderní jedinci vykazujú výrazné zníženie frekvencie pridružených alel (najvýraznejší variant vykazuje 64% rozdiel). Tento pokles je pravdepodobne spôsobený environmentálnymi zmenami spojenými s európskou kolonizáciou, ktoré viedli k posunu selekčných tlakov, pričom negatívna selekcia mohla po kontakte pôsobiť na rovnaký gén. Posun výberového tlaku by navyše mohol korelovať s epidémiami prenášanými v Európe v 20. storočí, ktoré utrpeli v oblasti severozápadného pobrežia. Toto je jedna z prvých štúdií skúmajúcich jednotlivú populáciu v čase a je príkladom sily takýchto štúdií pri odhaľovaní rôznorodých demografických a adaptačných histórií.

výsledok

Vzorky a sekvenovanie

Aby sme preskúmali možné gény súvisiace s imunitou pod výberom pred kontaktom s Európou, sekvenovali sme exomy starodávnych a moderných jedincov prvého národa v oblasti Prince Rupert Harbor (PRH) v Britskej Kolumbii v Kanade (doplnkový obrázok 1, doplnková poznámka 1). Potom sme vykonali genómové skenovanie na pozitívny výber a funkčnú charakterizáciu génov vykazujúcich najsilnejšie signály. Výsady 25 moderných jednotlivcov z dvoch pobrežných cimšských komunít, Metlakatla a Lax Kw'alaams (ďalej len „Tsimshian“), boli zoradené do priemernej hĺbky 9, 66 ×. 25 starých jedincov z archeologických nálezísk v regióne PRH (ďalej len „PRH Ancients“; doplnkový obrázok 1) je vo veku od 6 260 do 1 036 cal BP (doplnková tabuľka 1), pričom väčšina z nich patrí medzi 3 000 a 1 036 cal BP. Starodávne výkaly boli zoradené do priemernej hĺbky 7, 97 x (doplnková tabuľka 2). Odhady kontaminácie (tj exogénna DNA pochádzajúce z moderných zdrojov), pri použití exómových údajov, odhalili priemernú kontamináciu 0, 94% s 95% intervalom spoľahlivosti 0, 83–1, 10% (ref. 16; doplnková tabuľka 3). Všetkých 25 starých jedincov vykazovalo vzorce prechodov C → T a G → A v súlade s deamináciou v dôsledku poškodenia DNA post mortem 17, 18 (doplnkový obrázok 2). Mitochondriálne haploskupiny boli stanovené pre každého starodávneho jedinca, všetky vykazovali haploskupiny predtým identifikované v domorodých Američanoch 19 (doplnková tabuľka 1).

Genetický vzťah medzi starými a modernými jedincami

Pred výberovým skenovaním sme skúmali genetický vzťah medzi starými a modernými jedincami, aby sme potvrdili kontinuitu medzi týmito dvoma skupinami. Pri týchto analýzach sa odstránili všetky polymorfné miesta C / T a G / A, aby sa chránilo pred zaujatosťou v dôsledku poškodenia DNA. Bolo uskutočnené viacrozmerné škálovanie na vyhodnotenie genetických vzťahov našich vzoriek k jednotlivcom z projektu 1 000 Genomes 20, ďalších populácií domorodých Američanov 21 a dvoch starých jedincov z Ameriky 22, 23 (obr. 1b, doplnková poznámka 2). Analýza odhalila afinitu medzi starými ľuďmi PRH a Tsimshianom, pričom Tsimshian sa unášal smerom k Európanom, ako sa očakávalo od predpokladanej európskej prísady 24 . Ďalej sme použili ADMIXTURE 25 na oddelenie našich vzoriek a iných svetových populácií do zhlukov. Táto analýza (v klastroch K = 5) naznačuje, že Tsimshian sú zmesou pôvodných zložiek pochádzajúcich z PRH Ancients a Európanov (obrázok 1a). Ďalej, vývojový vzťah medzi našimi vzorkami a inými svetovými ľudskými populáciami bol vyhodnotený pomocou TreeMix 26 . V prípade jedinej migrácie vykazujú starci PRH minimálny posun a javia sa ako predkovia Tsimshianovcov s európskou prísadou vyskytujúcou sa medzi týmito dvoma skupinami (obrázok 1c). Tieto analýzy, kombinované s miestnymi orálnymi dejinami a dôkazmi z archeológie a mitogenomov 19, umožnili usudzovať, že starí a novodobí jednotlivci predstavujú časom jedinú populáciu, ktorá zahŕňa predeurópsky a posteurópsky kontakt.

Image

a ) ADMIXTURE analýza znázorňujúca proporcie predkov za predpokladu, že počet genetických zložiek, K , je 2–5. Analýzy zahŕňali referenčné populácie z 1 súboru údajov projektu 20 Genomes Project Phase 2, domorodých Američanov vo vzorkách z Karitiana, Surui a Maya 21 a dve starodávne vzorky z Amerík - Saqqaq 22 a Anzick-1 (odkaz 23). b ) viacrozmerné škálovanie. Populácie domorodých Američanov (Surui, Mayov a Karitiana) padajú so starými obyvateľmi PRH a starou vzorkou Anzick-1 z Montany. Moderný Tsimshian spadá pozdĺž stúpania od domorodých Američanov a Európanov, čo odráža ich zmiešanú históriu s Európanmi. c ) TreeMix graf s jednou udalosťou prímesí.

Obrázok v plnej veľkosti

Demografický model

Vyvodili sme tiež populačnú históriu Tsimshianu s prihliadnutím na úzke miesto, ktoré nastalo po európskom kontakte 1, 27, 28 (obr. 2, pozri časť „Metódy“). S využitím starodávnych aj moderných exómových údajov sa odvodili demografické parametre pomocou frekvenčného spektra odvodeného spoločného miesta potenciálnych synonymných miest vzhľadom na ľudský referenčný genóm hg19. Najlepšie vyhovujúci model naznačuje, že prekážka nastala ∼ 175 rokov BP (interval spoľahlivosti 95% interval spoľahlivosti: 125–225 rokov, tabuľka 1) u predkov moderného Tsimshian so sprievodným znížením skutočnej populácie o 57%. Načasovanie úzkych miest sa zhoduje so zdokumentovanými epidémiami kiahní 19. storočia a historickými správami o rozsiahlej populácii klesá 29, 30 . Väčšina európskych prímesí v populácii sa pravdepodobne vyskytla po epidémiách 24, 29 .

Image

Najlepšie vyhovujúci model znázorňujúci úzke miesto Tsimshian po európskom kontakte a následné zmiešanie s Európanmi. Pevné demografické parametre sú od Gravel et al . 55 a primiešavacie parametre sú od Verdu a kol . 24 . Parametre v modrej farbe boli odvodené s FastSimCoal2 (odkaz 54). Veľkosti populácie a časové úseky nie sú zobrazené v mierke. Štítky modelu sú definované ako: N AF, africká efektívna veľkosť populácie ( N e ); N CHB, CHB Ne; N GBR, GBR Ne; N PRH, PRH Ancients N e ; N Tsim, Tsimshian N e ; T NA, čas rozdelenia medzi PRH Ancients a CHB; T B_Col, čas úzkeho miesta v koloniálnom kontakte.

Obrázok v plnej veľkosti

Tabuľka v plnej veľkosti

Vyhľadá pozitívny výber

Aby sme sa ochránili pred falošne pozitívnymi signálmi pozitívneho výberu kvôli zjavnej prímesi cimšských jedincov s Európanmi, vykonali sme korekciu prímesí (pozri časť „Metódy“). Populácie boli skenované na selekčné signály, s korekciou a bez korekcie na prímes, s využitím štatistickej vetvy populácie (PBS) 31 . PBS sa ukázal ako účinný pri detekcii pozitívne vybraných lokusov medzi vysokohorskými populáciami 31, 32 . Tretia porovnávacia populácia slúžila dvadsaťpäť osôb Han z Pekingu (CHB), ktoré sú súčasťou projektu 1 000 Genomes 20 . Štatistika vypočíta množstvo diferenciácie v danom mieste pozdĺž vetvy vedúcej k špecifickej populácii porovnaním transformovaných hodnôt F ST medzi každou dvojicou troch populácií. Obrázok 3a zobrazuje populačne špecifickú diferenciáciu priemeru v exóme a pre náš najlepší kandidátny gén ( HLA-DQA1 ), ktorý je diskutovaný nižšie.

Image

a ) Stromy založené na exómoch širokého spektra údajov, pričom ľavý strom vykazuje malú dĺžku vetvy predkov PRH v porovnaní s Tsimshianom a CHB a pravý strom vykazuje silnú diferenciáciu pozdĺž vetvy pôvodcov PRH v géne HLA-DQA1 . ( b, c ) Manhattanské grafy skóre PBS vypočítané na základe pre SNP ako funkcia polohy SNP na chromozóme 6 pre PRH Ancients (b ) a moderného Tsimshiana ( c ). Červene vyznačená oblasť ukazuje skóre PBS pre SNP do 10 kb génu HLA-DQA1 .

Obrázok v plnej veľkosti

Počítali sme PBS na základe génov, s hodnotami P pre každý gén vypočítanými porovnaním pozorovaných skóre PBS s distribúciou vypočítanou pri neutrálnych simuláciách. Uvádzame gény s hodnotami P pod hladinou významnosti 0, 05 (tabuľka 2). Gény vykazujúce najextrémnejšie a najvýznamnejšie hodnoty PBS v PRH Ancients predstavujú silných kandidátov na pozitívnu selekciu, z ktorých hlavný kandidát HLA-DQA1 je priamo zapojený do imunitnej funkcie (tabuľka 2). Obohatené génové ontológie sa tiež identifikovali zo zoradeného zoznamu génov generovaných skenovaním PBS, ktoré zvýrazňujú imunitné funkcie súvisiace s prezentáciou antigénu (tabuľka 3). Na vyhodnotenie toho, či boli výberové signály extrémne relatívne k očakávaniam pod neutrálnosťou, boli skóre PBS porovnané s rozdelením skóre na základe neutrálnych simulácií s použitím našej odvodenej demografickej histórie (doplnkový obrázok 3). Varianty od najvyššieho kandidáta s najvýraznejšími zmenami frekvencie boli potvrdené Sangerovým sekvencovaním vo všetkých starodávnych vzorkách vykazujúcich údaje (doplnkový obrázok 4, doplnková poznámka 3).

Tabuľka v plnej veľkosti

Tabuľka v plnej veľkosti

Relevantnosť génu HLA-DQA1

Najextrémnejšie skóre PBS patrilo do génu HLA-DQA1 , ktorý kóduje alfa reťazec hlavného histokompatibilného komplexu (MHC), trieda II, DQ1 izoformy. Jednonukleotidový polymorfizmus HLA-DQA1 (SNP) s najvýraznejším rozdielom vo frekvencii medzi pôvodcami PRH (100%) a Tsimshianom (36%) spadá do nepreloženej oblasti 5 '(tabuľka 4). Táto oblasť môže naznačovať selekciu pôsobiacu na reguláciu génu, pretože asociované alely vykazujú dôkaz alterácií chromatínu a zásahov eQTL v rôznych bunkách - vrátane monocytov-CD14 + a primárnych T buniek pomocných 17 (doplnková tabuľka 4). Chromozomálna oblasť, v ktorej je gén umiestnený, tiež vykazuje silnú diferenciáciu pozdĺž vetvy vedúcej k PRH starcom (obr. 3).

Tabuľka v plnej veľkosti

HLA-DQ je jedným z troch hlavných typov molekúl MHC triedy II spolu s DR a DP a je exprimovaný hlavne v bunkách prezentujúcich antigén 34 . Molekuly MHC triedy II sú zodpovedné za väzbu na peptidy extracelulárneho patogénu a ich prezentáciu pomocným bunkám CD4 + T, ktoré aktivujú cielenú adaptívnu imunitnú reakciu voči pridruženému mikróbu 35 . O molekulách je známe, že sú vysoko polymorfné, hlavne v dôsledku sekvenčných rozdielov zodpovedajúcich väzbovej doméne molekuly, ktoré môžu ovplyvniť väzbové afinity 36 . Z dôvodu tejto rozmanitosti vo väzbových doménach môžu mať rôzne izoformy MHC triedy II rôzne výsledky ochorenia v dôsledku obmedzenia uloženého na aktiváciu T-buniek 35 . Polymorfná povaha týchto molekúl v rôznych populáciách by však nevysvetlila zvýšenú diferenciáciu v PRH Ancients s ohľadom na ich predpokladané potomky, Tsimshian.

Štruktúra haplotypu a lokálny pôvod HLA-DQA1

Najvyšší kandidát na selekciu v starodávnej populácii, HLA-DQA1, vykazoval zmeny vefkých alel v oblasti UTR5 modernej populácie (tabuľka 4). Aj keď v prastarých vzorkách existuje mierna referenčná odchýlka kvôli mapovaniu a prípadne dizajnu našich zachytávacích sond (doplnkový obrázok 5, doplnková poznámka 4), k tejto vlastnosti nemožno pripísať vysokú frekvenciu, pretože odvodené alely, ktoré sa pravdepodobne vyberajú, sú pre alternatívnu alelu. Aby sme zhodnotili, či zmena frekvencie bola spôsobená európskou prímesou, skúmali sme štruktúru haplotypov medzi populáciami. Aby sme vizualizovali haplotypy v oblasti HLA-DQA1 , fázovali sme staré a moderné vzorky pomocou Beagle 4.1 (odkaz 37). Zo starobylej vzorky PRH 125 sme vybrali náhodne vybraný haplotyp a vypočítali sme počet párových rozdielov k tomuto haplotypu pre každý haplotyp v moderných a starodávnych vzorkách, ako aj vo vzorkách Veľkej Británie (GBR) z údajov o fáze 3 1 000 genomov 38 . Potom sme usporiadali haplotypy na základe ich počtu párových rozdielov k tomuto svojvoľne vybranému haplotypu zo vzorky PRH 125 a zoskupili sme ich podľa populácie. Doplnkový obrázok 6 ukazuje podobné haplotypy medzi starými a modernými jedincami, zatiaľ čo u európskej populácie sú odlišné.

Ďalej sme skúmali miestny pôvod génu HLA-DQA1 . Použili sme RFMix 39 na odvodenie predkov pozdĺž chromozómu 6 v modernej Tsimshianskej populácii. Použili sme program PopPhased, ktorý koriguje chyby postupného zavádzania, a veľkosť okna 0, 2 cM, štyri generácie od udalosti prímesí medzi Tsimshianom a Európanmi a 100 stromov vygenerovaných v náhodnom lese. Pre referenčný panel sme použili údaje fázy 3 z projektu 1 000 Genomes 38 . Použili sme 25 jedincov z GBR (európsky panel), CHB (východoázijský panel) a PEL (domorodý americký panel, peruánsky jazyk v Lime). Vybraný PEL nevykazoval žiadne prímesi (pozri časť „Metódy“). Doplnkový obrázok 7 naznačuje, že európskemu predku bolo možné pripísať iba jeden haplotyp, zatiaľ čo zvyšných 49 sa pripisuje pôvodnému americkému pôvodu.

Simulácie trajektórií alel HLA-DQA1

Aby sme preskúmali, či je možné rozdiely frekvencií alel medzi týmito dvoma časovými obdobiami vysvetliť dlhodobým výberom vyváženia, posunom alebo zmenami vo výberových tlakoch, vykonali sme sériu simulácií na základe nášho demografického modelu. Najprv sme skúmali, či by dlhodobý výber vyváženia v rámci výhody heterozygotov mohol vysvetliť naše údaje. Parametre odvodené z nášho demografického modelu boli implementované do simulátora SLiM 40 s predstihom. De novo mutácia bola zavedená v minulosti 5 miliónov rokov (za predpokladu generačného času 25 rokov), ktorá sa vyvinula s výhodou heterozygotov (selekčný koeficient na generáciu s = 0, 1 a dominantný parameter h = 100) až do súčasnosti. Distribúcia výsledných skóre PBS sa môže porovnať s pozorovanými údajmi na obrázku 4a. Pretože distribúcia skóre PBS pri dlhodobom výbere vyváženia je posunutá smerom k malým hodnotám v porovnaní s neutrálnosťou (obrázok 4a), údaje sú nekonzistentné s výberom dlhodobého vyváženia pri výhode heterozygotov.

Image

a ) Distribúcia skóre PBS pre simulácie dlhodobého vyrovnávacieho výberu (výhoda heterozygotov) zahŕňajúce genomickú oblasť rovnakej dĺžky ako prepis HLA-DQA1 . Vzhľadom na pozorované skóre PBS v starovekej populácii je táto forma výberu vyváženia v rozpore s našimi údajmi. b ) Empirické rozdelenie zmien frekvencie pre všetky odvodené alely v exome medzi starou a modernou populáciou, pričom SNP HLA- DQA1 UTR5 sa javia ako odľahlé hodnoty. c ) Simulácie rôznych selekčných schém a frekvencie alel SNP HLA-DQA1 pozorované v modernom Tsimshian. Zmeny frekvencie aliel medzi starou a modernou populáciou sa nedali vysvetliť naším demografickým modelom (posun v dôsledku neutrality po európskom kontakte) alebo taký, ktorý zahŕňal iba pozitívny výber (žiadny posun od pozitívneho výberu po európskom kontakte). Žiadna zo simulácií, v ktorých pôvodne pozitívne vybraná alela nie je neutrálna alebo stále v pozitívnom výbere po čase európskeho kontaktu, nedosiahla pozorovanú frekvenciu aliel v modernej populácii. Model, ktorý zahŕňal negatívny výber po európskom kontakte, lepšie vyhovoval našim údajom, kde ∼ 26% simulácií dosiahlo pozorovanú frekvenciu.

Obrázok v plnej veľkosti

Na modelovanie evolučných síl pôsobiacich na alely odvodené od HLA-DQA1 po európskom kontakte sme vybrali frekvenciu alely vykazujúcu najväčšiu zmenu 0, 67. Na vyhodnotenie modelov s pozitívnym výberom, neutrálnosťou a negatívnym výberom sme použili prístup založený na simulácii, ktorý je podrobne opísaný v časti „Metódy“. Rovnaký prístup sme použili aj na získanie odhadov korelácie medzi časom zmeny prostredia ( t ) a selekčným koeficientom (koeficienty) (doplnkový obrázok 8). Obrázok 4c ukazuje, že ani naše striktné schémy pozitívneho výberu, ani schémy zahŕňajúce pozitívny výber, po ktorom nasleduje prechod k neutrálnosti, by nemohli zodpovedať našim údajom (žiadna zo simulácií nedosiahla pozorovanú frekvenciu v modernej populácii). Model s posunom od pozitívneho k negatívnemu výberu bol však kompatibilný, keď 26% simulácií dosiahlo alebo prekročilo pozorovanú frekvenciu.

Tiež sme skúmali, či pozorovanú frekvenciu aliel v starobylej populácii možno lepšie vysvetliť skôr unášaním než výberom. Rovnakou všeobecnou metódou sme simulovali počiatočné frekvencie alel v čase, keď sa domorodí Američania oddelili od populácie východnej Ázie náhodným výberom frekvencií alel od spätnej simulácie podmienenej modernou frekvenciou CHB. Potom sme simulovali frekvenciu alel pred 60 generáciami - časom, v ktorom sa odobrali vzorky starej populácie. Výsledné rozdelenie na doplnkovom obrázku 9 ukazuje, že neutrálny scenár nie je pre naše údaje vhodný. Vidíme tiež, že empirické rozdelenie všetkých zmien frekvencie SNP medzi starými a modernými jedincami ukazuje varianty HLA-DQA1 ako odľahlé hodnoty (obrázok 4b).

diskusia

Náš jedinečný súbor údajov nám umožnil preskúmať demografiu jedinej indiánskej populácie v troch rôznych časových rámcoch. Najprv sme populáciu skúmali z časového obdobia 5 000 rokov, ktoré viedlo k európskemu kontaktu. Selekčné skenovanie starodávnych jedincov z tohto obdobia odhalilo najlepšieho kandidáta na pozitívny výber HLA-DQA1, čo vyvodzuje imunitnú adaptívnu udalosť. Ďalej sme odvodili závažnosť kolapsu populácie po kontakte s Európou, ktorá koreluje s historickým poklesom populácie spojeným s regionálnymi epidémiami kiahní 30, ako aj so všeobecnými odhadmi poklesu populácie indiánov na základe diverzity mitochondriálnej DNA 27, 41 . Počas kontaktného obdobia môže byť významný aj predchádzajúci dlhodobý pozitívny výber génu HLA-DQA1 . Receptor HLA-DQ je spojený s celým radom infekčných chorôb z kolonizácie, vrátane osýpok 42, tuberkulózy 43, 44, a s adaptívnou imunitnou odpoveďou na vírus vakcínie, ktorý je oslabenou formou kiahní 45, 46 . Potrebné sú ďalšie štúdie, aby sa zistilo, či staré alely, ktoré sú pravdepodobne v pozitívnom výbere, môžu predstavovať rozdielny výsledok ochorenia, pokiaľ ide o európske patogény, ako aj ich vplyv na cieľové gény po prúde.

Pri skúmaní populácie po kontakte a do súčasnej doby však varianty génu HLA-DQA1 zažívajú výraznú zmenu frekvencie. Táto zmena predstavuje zložitejší scenár, keď sa zohľadňujú všetky tri časové rámce. Po prvé, skenovanie pozitívnej selekcie v modernom Tsimshian, s korekciou a bez korekcie na európsku prímes, neodhalilo žiadny štatisticky významný výber na imunitne príbuzných génoch (doplnkové tabuľky 5 a 6). Analýzy obohatenia génovej ontológie tiež nenavrhli koreláciu s imunitnou funkciou (doplnková tabuľka 7). Po druhé, samotná demografia nedokázala vysvetliť veľkú zmenu frekvencie v alelách HLA-DQA1 medzi starými a modernými skupinami na základe simulácií (obrázok 4c). Európska prímesi u moderných jednotlivcov tiež nezohľadňovala zmeny frekvencie, pretože haplotypy v tejto oblasti možno pripísať rodeniu indiánov (doplnkový obrázok 7). Okrem toho HLA-DQA1 zostal najlepším zásahom PBS pri skenoch zahŕňajúcich tak európsku korekciu prímesí (doplnková tabuľka 9), ako aj ďalší sken, do ktorého boli zaradení indiánski jedinci z inej modernej populácie (čo naznačuje regionálnu adaptívnu udalosť) (doplnková tabuľka 8; bol štvrtým najlepším kandidátom, pričom prvé tri boli funkčne necharakterizované).

Preto sme preskúmali alternatívne vysvetlenia pozorovanej zmeny frekvencie alel HLA-DQA1 v čase po kontakte. Pretože u HLA génov sa predtým predpokladalo, že sú pod vyváženým výberom u ľudí 47, 48, skúmali sme možnosť, že výber dlhodobého vyváženia by mohol vysvetliť naše údaje simuláciou podľa modelu heterozygotnej výhody podmienenej našim odvodeným demografickým modelom. Zistili sme, že tento špecifický typ vyvažovacej selekcie je zlý na údaje, pričom HLA-DQA1 gén je stále extrémne vzdialený od výsledkov simulácie (obr. 4a). Ďalej sme použili prístup založený na simulácii vpred na vysledovanie trajektórií alel HLA-DQA1 pod rôznymi výberovými modelmi po bode európskeho kontaktu. Zistili sme, že simulácie podľa nášho demografického modelu, ktorý bol upravený tak, aby nezahŕňal európsku prímes, vzhľadom na naše miestne výsledky o pôvode (doplnkový obrázok 7), neboli dostatočné na vysvetlenie zmeny frekvencie v modernej populácii - pričom žiadna zo 4 simulácií nedosiahla pozorovaná frekvencia (obr. 4c). Pri použití modelu negatívnej selekcie v čase kontaktu sme však zistili, že simulované frekvencie aliel sú kompatibilné s pozorovanými frekvenciami v modernej populácii (Obr. 4c). Aj keď sme neboli schopní presne identifikovať selekčný koeficient potrebný na riadenie zmeny frekvencie alel (keďže pravdepodobnostná plocha je relatívne plochá, doplnkový obrázok 8), je pravdepodobné, že došlo k relatívne silnému negatívnemu výberu. Takáto sila by sa dala očakávať v časovom rámci menej ako siedmich generácií a koreluje s vysokou mierou úmrtnosti spojenou s regionálnymi epidémiami kiahní v 18. storočí, ktoré dosiahli 70% (odkaz 30).

Výsledky prezentované tu ukazujú vývojovú históriu, ktorá trvá tisíce rokov. Imunitné alely, ktoré vykazujú silné signály pozitívnej selekcie u starých domorodých Američanov zo severozápadného pobrežia, pravdepodobne korelujú s adaptáciou na patogény, ktoré boli prítomné v dávnych prostrediach regiónu. Naše výsledky tiež naznačujú, že pôvodná populácia mohla mať negatívny výber na rovnakú imunitne súvisiacu genetickú zložku po kontakte s Európou a následnom páde populácie. Posun môže predstavovať formu výberu vyváženia v dôsledku kolísajúcich prostredí 49 . Tento záver bol možný iba prostredníctvom nášho skúmania jednej populácie v priebehu času, odhaľovania nuančných demografických udalostí a užitočnosti takýchto štúdií. Okrem toho tu uvedená podrobná evolučná história pomáha lepšie pochopiť skúsenosti domorodých Američanov s ochorením v starovekom aj v koloniálnom období tým, že demonštruje posun v imunitných selekčných tlakoch spojených s environmentálnym dosahom európskeho kontaktu.

metódy

Etika a zapojenie komunity

Tento projekt bol umožnený prostredníctvom aktívnej spolupráce Prvých národov Metlakatla a Lax Kw'alaams. Spoločenstvá sa nachádzajú v oblasti Prince Rupert Harbor (PRH) v Britskej Kolumbii. Spoločnosti RSM a JSC v rokoch 2007 a 2008 založili spoluprácu s týmito dvoma komunitami, ktorá každoročne navštevuje správy o najnovších výsledkoch DNA a získava spätnú väzbu o výsledkoch. 25 exomov od moderných jednotlivcov generovaných v tejto štúdii pochádzalo z týchto dvoch komunít. Obe komunity sa dohodli, že umožnia analýzu DNA pôvodných jedincov získaných z archeologických nálezísk v regióne a momentálne umiestnených v Kanadskom múzeu histórie. Počas návštev a po rozsiahlych konzultáciách v komunite a po rozsiahlych konzultáciách bola schválená Inštitucionálna revízna rada University of Illinois (# 10538) protokol o výskume a dokumenty o informovanom súhlase - odsúhlasené domorodými komunitami a výskumníkmi. Všetci jednotlivci podpísali dokument informovaného súhlasu. RSM, JSC a JL navštívili komunitu každoročne počas štúdie, aby informovali o najnovších výsledkoch, a naďalej navštevujú prvé národy, aby podali správu o tejto a súvisiacich štúdiách.

Extrakcia DNA a príprava knižnice

Pripravili sme extrakty DNA od 25 starých jedincov z oblasti princa Ruperta z Britskej Kolumbie (doplnková tabuľka 1) a pripravili sme knižnice sekvencovania DNA v čistých priestoroch. 25 moderných vzoriek DNA sa podrobilo podobným postupom v samostatnom zariadení určenom iba na modernú DNA (doplnková poznámka 5).

Exome capture and Illumina sequining

Pre súčasné vzorky sa podľa protokolu výrobcu použila kombinácia súpravy Illumina TruSeq Exome Enrichment Kit a súpravy Nextera Rapid Capture Exome Kit (Illumina, San Diego, CA) (doplnková tabuľka 2). Jedna knižnica na jednotlivca bola sekvenovaná (jednosmerné čítania) a združená do celkom štyroch knižníc na jeden pruh na Illumina HiSeq 2000 v divízii High-throughput Sequencing Division WM Keck Biotechnology Center na University of Illinois Urbana-Champaign.

Pre starodávne vzorky sa použila iba sada Illumina TruSeq Exome Enrichment Kit. Pre každého starodávneho jednotlivca sa zachytili štyri knižnice a potom sa zhromaždili na sekvenovanie v jednom jazdnom pruhu. Na zachytenie sa použil protokol výrobcu s nasledujúcimi modifikáciami: namiesto guľôčok sa použila súprava Qiagen MinElute PCR Clean-up Kit, amplifikácia po zachytení zahŕňala 12 cyklov namiesto 10 a teplota hybridizácie sa znížila na 50 ° C.

Odhady kontaminácie

Na odhad kontaminácie v rámci celého genómu sme použili nástroj ContEst 16 . Tento nástroj používa Bayesovský prístup na vypočítanie zadnej a maximálnej a posteriori pravdepodobnosti úrovne kontaminácie v BAM súbore jednotlivca. Táto metóda sa ukázala ako účinná pri detekcii kontaminácie v exómoch s nízkym pokrytím 16 . Na odhady sa použili HapMap_3.3 globálne frekvencie obyvateľstva pre každý SNP, mapované na b37. Všetky staré vzorky vykazovali kontamináciu pod 1%, s výnimkou PRH Ancient 163. Odhady sú uvedené v doplnkovej tabuľke 3.

Zistenie variantu

Podrobnosti o mapovaní nájdete v doplnkovej poznámke 6. Čítanie pod dĺžkou 35 bolo odfiltrované pred mapovaním na hg19. Na analýzy vyžadujúce volania genotypov (napríklad TreeMix, ADMIXTURE, MDS a RFMix ) sa použil SAMtools-1.1 (ref. 50) s minimálnou kvalitou mapovania 30, minimálnou kvalitou základne 20, minimálnou hĺbkou čítania 6 a maximálna hĺbka čítania 80. Miesta sa tiež filtrovali na porušenie jednostranného testu na Hardy-Weinbergovu rovnováhu pri hodnote P <10 -4 (ref. 51). Vzhľadom na nízku strednú hĺbku čítania starcov PRH a Tsimshiana neboli genotypy priamo vyvolané na selekčné skenovanie ani na demografické modelovanie. Namiesto toho sa program ANGSD (ref. 52) použil na výpočet pravdepodobnosti genotypov pomocou modelu SAMtools a odhadu alelých frekvencií priamo z týchto pravdepodobností. Táto metóda sa použila na všetky populácie zvažované pri výberovom skenovaní. Pre demografický model sa odvodili odvodené frekvenčné spektrá spoločného miesta (SFS) pre všetky zvažované populácie pomocou ANGSD. Každé zarovnanie použité pri odhade bolo filtrované na minimálnu kvalitu mapovania 30, minimálnu kvalitu bázy 20, orezanú na každom konci po 5 bp, aby sa minimalizovala predpojatosť od deaminácie DNA a minimálna prahová hodnota P 10-6 .

Skenovanie s výberom PBS

Na detekciu oblastí s pozitívnym výberom v PRH Ancient aj Tsimshian sa použil PBS 31 . PBS 31 sa ukázal byť účinný pri detekcii adaptácie na hypoxiu v populáciách vo vysokých výškach 31, 32 . Používa skupinu troch populácií (nazývajú sa X , Y a Z ) a predpokladá, že majú korene v koreňoch (( X , Y ), Z ). Výpočet PBS v skutočnosti nevyžaduje zakorenený strom, a preto na ich špecifickom koreňovom vzťahu nezáleží.

Analogická štatistika sa môže vypočítať pre populácie Y a Z. V tejto štúdii sa zaoberáme situáciou, v ktorej X je PRH Ancients, Y je moderný Tsimshian a Z je Han Chinese (CHB z projektu 1 000 Genomes). Preto nás zaujímajú výpočty:

Image

Pretože analýzy ADMIXTURE a TreeMix (Obr. 1a, c) naznačujú pravdepodobnú prímesovú udalosť medzi moderným Tsimshianom a Európanmi, alelkové frekvencie v modernom Tsimshian boli korigované na prímes pomocou metódy opísanej Huerta-Sánchezom a kol . 32 . nechať

Image

a

Image

predstavujú frekvenciu alel v lokuse v Tsimshianskej populácii pred a po prímesi. Ďalej, za predpokladu, že využívame Európanov ako zástupcu, necháme to

Image

je frekvencia alel na rovnakom mieste v referenčnej európskej populácii (použili sme populáciu Veľkej Británie (GBR) z projektu 1 000 Genomes). Za predpokladu, že podiel predkov odvodených od Európanov v lokuse je α , podľa modelu okamžitej prímesi by frekvencia alel v Tsimshianskej po prímesi bola

Image

Preusporiadaním môžeme vyriešiť frekvenciu alel pred ich zmiešaním ako

Image

Odhadli sme α v každom lokuse výberom hodnoty a, ktorá minimalizovala F ST medzi populáciou Tsimshian s korekciou prímesí a skupinou Han Chinese (CHB) outgroup. Na skenovanie pre pozitívny výber sme použili frekvencie aliel s korigovanými prísadami.

Použili sme ANGSD (ref. 52) na výpočet alelých frekvencií pre moderné populácie Tsimshian, PRH Ancient, Han Chinese (CHB) a Great Britain (GBR) priamo zo surových sekvencovaní, čo viedlo k neistote vo volaní genotypu. Frekvencie alel boli založené na 25 nepríbuzných jednotlivcoch (doplnková tabuľka 10, doplnková poznámka 7) z každej populácie. Zatiaľ čo veľkosti vzoriek 10 poskytujú dostatočnú štatistickú moc pre diferenciáciu 53 ST ST, bola naša starodávna veľkosť vzorky zvýšená na 25 (čo zodpovedá 50 vzorkám haploidov), aby sa kompenzovala štatistická strata energie v dôsledku meniacej sa povahy starodávneho pokrytia exómom. Vyžadovali sme, aby čítanie malo kvalitu mapy najmenej 30 a každý nukleotid mal kvalitu najmenej 20. Tiež sme volali frekvencie aliel iba na miestach, na ktorých úplne nezmizli údaje od najmenej piatich jedincov. Aby sme navyše ochránili pred usmrtením post mortem, upravili sme prvých a posledných päť nukleotidov z každého odčítaného v prh starodávnych vzorkách. Frekvencie alel v modernom Tsimshiane boli následne korigované na potenciálny európsky pôvod (pozri postup v priamo predchádzajúcom odseku). Celkový počet použitých lokusov (vrátane monomorfných a polymorfných miest) pre každé skenovanie je nasledovný: staroveký, Tsimshian, CHB = 2 556 963; Staroveké, Tsimshian, CHB (korigované GBR) = 1 594 924; Staroveké, peruánske, CHB = 3 334 664. Ďalšie podrobnosti o skenovaní PBS nájdete v doplnkovej poznámke 8.

Hodnoty P selekcie pri selekcii PBS

Aby sme vypočítali hodnoty P pre pergénové skenovanie PBS, najprv sme získali distribúciu dĺžok transkriptov RefSeq a k tejto dĺžke sme pridali 20 kilobáz. Tento postup mal napodobniť skenovanie podľa génu, v ktorom sme vypočítali PBS pre daný gén so zahrnutím 10 kilobáz pred a za génom. Na základe odvodeného demografického modelu (obr. 2) sme vykonali 105 náhodných neutrálnych simulácií pomocou FastSimCoal2 ( 66 ). Pre každú simuláciu replikácie sme náhodne nakreslili sekvenčnú dĺžku rovnomerne z distribúcie dĺžok transkriptov RefSeq (plus 20 kilobáz). V každej simulácii sme odobrali vzorky 50 haplotypov (25 diploidných jedincov) z každej zo štyroch populácií (predstavujúcich PRH Ancient, Tsimshian, CHB a GBR). Potom sme sa pokúsili korigovať frekvenciu alel v populácii predstavujúcej moderného Tsimshiana použitím postupu identického s postupom opísaným v časti „Metódy“.

Hodnoty P pre sken na gény v PRH Ancients boli získané identifikáciou podielu 105 neutrálnych simulácií, v ktorých boli hodnoty PBS pre populáciu predstavujúcu PRH Ancients extrémnejšie. Asociované hodnoty P pre top dva kandidátne gény sú uvedené v tabuľke 2. Je potrebné poznamenať, že hodnoty P boli generované za predpokladu neutrálneho modelu. Údaje však pochádzajú z génov (najmä exómov), ktoré sa pravdepodobne neutrálne nevyvíjajú a mnohé z nich sú pravdepodobne pod selektívnym obmedzením. Toto obmedzenie výberu by viedlo k posunu empirického rozdelenia hodnôt PBS na tie, ktoré sú menšie. Preto by neutrálne miesta mali tendenciu mať vyššie hodnoty PBS. Na rozdiel od simulovanej a empirickej distribúcie PBS (doplnkový obrázok 3) je zrejmé, že empirická distribúcia PBS je posunutá na menšie hodnoty. Avšak najvyšší kandidát HLA-DQA1 je podľa empirickej distribúcie značne vzdialený. Simulácie zahŕňajúce skôr purifikáciu výberu než neutrálne simulácie by preto pravdepodobne zvýšili význam HLA-DQA1 .

Demografický historický model

Parametre demografického modelu (obr. 2) boli odvodené pomocou FastSimCoal2 (ref. 54). Fixné parametre boli implementované od Gravel et al . 55 a boli nasledujúce: z afrického obmedzenia ( N = 1 861, T = 51kya) 55, rozdelené medzi CHB a GBR (slúžiace ako strašidelná populácia) ( N GBR = 1 032, N CHB = 550; T = 23kya) 55, Zmes medzi GBR a Tsimshianom ( T = 100 rokov, frakcia prímesí = 0, 33) bola prevzatá od Verdu a kol . 24 . Pre odvodené hodnoty sa vykonalo sto optimalizácií, pričom z každej zo 100 sád sa získali parametre najlepšej pravdepodobnosti. Dáta boli simulované s efektívnou dĺžkou sekvencie 7, 4 Mb a rýchlosťou mutácie a rekombinácie na bázu na generáciu 2, 5 x 10-8 . Pri optimalizácii sa používali odvodené SFS pre CHB, PRH Ancients a Tsimshian. Európska populácia (Veľká Británia označená GBR) v modeli slúžila ako strašidelná populácia. Tento SFS obsahoval 7, 4 Mb monomorfných a polymorfných miest na základe potenciálnych synonymných miest hg19, kde boli údaje o každom jednotlivcovi uvedené. Na zostrojenie 95% intervalov spoľahlivosti sa použil parametrický bootstrapovací prístup. Odvodené parametre a intervaly spoľahlivosti sú uvedené v tabuľke 1.

Simulácia dlhodobej rovnováhy s výhodou heterozygotov

Aby sa preskúmalo, či by výber dlhodobého vyváženia mohol lepšie vysvetliť naše údaje ako pozitívny výber, parametre odvodené z nášho demografického modelu sa implementovali do dopredného simulátora SLiM (ref. 40). SLiM neumožňuje nepretržitý exponenciálny rast, takže bola vypočítaná ekvivalentná efektívna veľkosť populácie populácií CHB a GBR. To znamená, že efektívna veľkosť s rovnakým množstvom uplynutého koalescentného času ako pri exponenciálnom raste. De novo mutácia bola zavedená v minulosti 5 miliónov rokov (za predpokladu generačného času 25 rokov), ktorá sa vyvinula s výhodou heterozygotov (selekčný koeficient na generáciu s = 0, 1 a dominantný parameter h = 100) až do súčasnosti. Zachovali sa iba simulácie, pri ktorých sa vybraná mutácia nestratila. Simulácia zahŕňala oblasť, ktorá bola rovnaká ako dĺžka transkriptu HLA-DQA1 +20 kb (10 kb proti smeru toku a po prúde, ako v našej analýze PBS). Náhodne sa odobralo päťdesiat chromozómov v každej zo štyroch populácií (predstavujúcich populácie PRH, moderné populácie Tsimshian, CHB a GBR) a PBS sa vypočítal ako vo všetkých ostatných analýzach. Korekcia prímesí sa použila aj na údaje z týchto simulácií. Distribúciu výsledných skóre PBS je možné vidieť ako prekrývanú s pozorovanými údajmi a neutrálnymi simuláciami na obrázku 4a. Pretože distribúcia skóre PBS pri dlhodobom výbere vyváženia je posunutá smerom k malým hodnotám v porovnaní s neutrálnosťou, údaje nie sú konzistentné s výberom dlhodobého vyváženia.

Simulácie výberu

Na modelovanie evolučných síl pôsobiacich na odvodenú alelu v rs9272426 po európskom kontakte sme použili prístup založený na simulácii na vyhodnotenie modelov pod pozitívnym, neutrálnym a negatívnym výberom, ktorý je podobný tomu, ktorý je opísaný v Nakagome et al . 56 . Rovnaký prístup sme použili aj na získanie odhadov korelácie medzi časom zmeny prostredia ( t ) a selekčným koeficientom (koeficientmi). Najprv sme spustili Wright-Fisherov model založený na spätnej simulácii odvodenej alelej frekvencie v CHB pod neutrálnym modelom, aby sme vzorkovali alelkovú frekvenciu ( f T : 605 ) pred 605 generáciami, čo je odhadovaný čas, v ktorom sa pôvodní domorodí Američania rozdelili. z CHB podľa nášho demografického modelu, za predpokladu, že aktuálna frekvencia bola 0, 475 (frekvencia 1 000 Genomes CHB) a konštantná veľkosť populácie 8 250 diploidných jedincov. Vypočítali sme túto konštantnú veľkosť populácie ako efektívnu veľkosť s rovnakým množstvom uplynutého koalescentného času, aký sa použil pri exponenciálnom raste predpokladanom pre CHB v našom demografickom modeli. Potom sme začali simuláciu v Tsimshian s počiatočnou frekvenciou fT : 605, pričom sme vzali do úvahy demografické účinky založené na našom modeli, v ktorom efektívna veľkosť populácie ( N e ) medzi 605 a 7 generáciami bola 13 975 diploidov a znížila sa na 6 006 diploidov. pred 7 generáciami (obr. 2). Pretože sme v našich starodávnych vzorkách pred 60 generáciami ( f T : 60 = 1, 0) zistili podpisy selekcie na odvodenej alele na základe štatistiky PBS ( f T : 60 = 1, 0), vzorkovali sme selekčný koeficient ( pôvodný ) z U (0, 0, 0, 1) a iba akceptované trajektórie, ak frekvencia pred 60 generáciami bola> 80%. Keď trajektória dosiahla pred 12 generáciami, keď sa európsky kontakt vyskytol v Britskej Kolumbii, predpokladali sme tri rôzne modely s posunom selektívnych tlakov na túto alelu alebo bez neho zmenou s na 0, 0 (neutrálny) alebo novo vzorkovaním s z U (0, 0, - - 0, 3) (negatívny výber) alebo použitím originálu s = s (pozitívny výber). Potom sme vypočítali frekvenciu alel v súčasnosti pomocou binomického vzorkovania s celkovým počtom chromozómov (50 v našich vzorkách) a aktuálnou frekvenciou v trajektórii ( prítomná f ).

Odhadli sme spoločnú zadnú distribúciu t a s danú fT : 60 v starých vzorkách a pozorovanú frekvenciu v moderných vzorkách ( f obs ) podľa modelu negatívnej selekcie. Podobne ako v prvom kroku sme vzorkovali fT : 605 z neutrálnej distribúcie generovanej spätnou simuláciou v CHB a modelovali trajektóriu, ktorá začala od fT : 605 a zvýšili frekvenciu s pôvodným vzorkovaním z U (0, 0, 0, 1). Informácie o fT : 60 = 1, 0 boli začlenené do trajektórie jej zamietnutím, ak f T : 60 <0, 8. Pri tejto simulácii sme tiež odobrali vzorky t z U (0, 30), ako aj s z U (0, 0, −0, 5). V našej modernej vzorke Tsimshian sme použili 0, 37 ako pozorovanú frekvenciu, s 19 odvodenými a 31 predkami pozorovanými alelami v moderných vzorkách. Odhadli sme spoločné zadné rozdelenie t a s vzhľadom na pozorovanú frekvenciu v našich starodávnych a moderných vzorkách prijatím 10 000 vzoriek (doplnkový obrázok 8).

Tiež sme skúmali, či pozorovanú frekvenciu aliel v starobylej populácii možno lepšie vysvetliť skôr unášaním než výberom. Použitím rovnakej všeobecnej simulačnej metódy, ktorá bola opísaná vyššie, sme simulovali počiatočné frekvencie alel v čase, kedy sa domorodí Američania oddelili od východoázijských populácií náhodným výberom frekvencií alel od spätnej simulácie podmienenej modernou frekvenciou CHB. Potom sme simulovali frekvenciu alel pred 60 generáciami, v čase, keď sa odobrali vzorky starej populácie. Výsledné rozdelenia na doplnkovom obrázku 9 ukazujú, že neutrálny scenár nie je pre naše údaje vhodný.

Posúdenie rozdielov v pokrytí medzi populáciami

Skúmali sme distribúciu pokrytia v staroveku PRH, v moderných populáciách Tsimshian a CHB v celom genóme, v chromozóme 6 av oblasti HLA-DQA1 (doplnkový obrázok 10). Ako sa očakávalo od degradácie starobylej DNA, starci PRH vykazujú viac chýbajúcich údajov ako obe moderné populácie. Úroveň chýbajúcich údajov v genóme a v chromozóme 6 je však podobná. Región HLA-DQA1 ukazuje, že pokrytie pre starcov PRH je menšie ako moderný Tsimshian a že moderný Tsimshian je nižší ako CHB. Aj keď pozorujeme pokles pokrytia v moderných Tsimshianových a PRH predkoch v porovnaní s úrovňou pozadia, počet pozorovaných alel je vždy> 20 (tj 10 diploidných jedincov), čo je dostatočné na výpočet presných hodnôt F ST a je viac ako dvakrát taká veľká ako minimálna prahová hodnota nezvestných jednotlivcov (päť diploidov alebo 10 alel) na volanie frekvencie alel v našom plynovode ANGSD . Ďalej, vysokofrekvenčný variant identifikovaný pomocou nášho skenovania PBS bol potvrdený Sangerovým sekvencovaním u 18 diploidných jedincov (36 celkom alel) z PRH Ancients (doplnkový obrázok 4), čo naznačuje, že nie je to veľkosť vzorky, ktorá riadi pozorované vzory PBS.,

Analýza TreeMix

Začali sme s identickým filtrovaným súborom údajov nazývaným genotypy opísaným v časti „Metódy“. TreeMix 26 sa použil na množinu údajov na vygenerovanie stromov s najväčšou pravdepodobnosťou a grafov prímesí z dát frekvencie alel. Populácia projektu Yoruban (YRI) 1 000 Genomes bola použitá na zakorenenie stromu (s voľbou - root). Zohľadnili sme nerovnováhu spojenia zoskupením susedných miest M (s možnosťou –k ) a vybrali sme si M tak, že súbor údajov s lokalitami L bude mať približne

Image

nezávislé stránky. Na túto analýzu bolo použitých celkom 1 820 polymorfných lokusov. Na konci analýzy (tj počet migrácií) sme vykonali globálne preusporiadanie (s globálnou možnosťou). Zohľadnili sme prímesové scenáre s migračnými udalosťami m = 0 a m = 1. Každý migračný scenár bol spustený so 100 replikami a pre najvyššiu pravdepodobnosť stromu alebo grafu pre daný migračný scenár bol vybraný replikát s najvyššou pravdepodobnosťou.

Doplnkový obrázok 11 zobrazuje výsledky pre strom maximálnej pravdepodobnosti bez udalostí prímesí ( m = 0). V tejto štúdii padajú súčasné caimshianské predky moderným stredoeurópskym a juhoamerickým vzorkám (Surui, Karitiana a Mayan), ako aj starej vzorke z Montany (Anzick-1) a starým vzorkám PRH genotypizovaným v tejto štúdii. Výsledky ADMIXTURE z obr. La však odhalili veľkú európsku zložku v modernom Tsimshian, ale nie v PRH Antcients, pravdepodobne spôsobí, že moderný Tsimshian klesne medzi domorodých Američanov a Európanov na strom. Okrem toho Mayský pád patrí k vzorke Anzick-1, čo je výsledok maskovania nedávnej európskej prímesi v tejto vzorke (pozri aj obrázok 1c). Obrázok 1c (graf TreeMix ) a doplnkový obrázok 12 (b) (zodpovedajúce zvyšky) zobrazujú výsledky s jednou udalosťou prímesi ( m = 1). Mimoriadna migračná udalosť koriguje európsky pôvod, ktorý sa pozoroval v modernom Tsimshian, a posúva umiestnenie na Tsimshian ako sesterskú populáciu (to znamená tvorí kladu) so starou populáciou PRH.

Dostupnosť údajov

Starodávne údaje sú dostupné z NCBI Sequence Read Archive, prístupové číslo PRJNA288803. Údaje od moderných jednotlivcov sú dostupné prostredníctvom dohody o prístupe k údajom s RSM na University of Illinois. Všetky ostatné údaje sú k dispozícii od autorov na základe odôvodnenej žiadosti.

Doplnková informácia

Súbory PDF

  1. 1.

    Doplnková informácia

    Doplnkové obrázky 1-12, doplnkové tabuľky 1-10, doplnkové poznámky 1-8 a doplnkové odkazy

  2. 2.

    Súbor s recenziou

Komentáre

Odoslaním komentára súhlasíte s tým, že budete dodržiavať naše zmluvné podmienky a pokyny pre komunitu. Ak zistíte, že je niečo urážlivé alebo nie je v súlade s našimi podmienkami alebo pokynmi, označte ho ako nevhodné.