DNA tutkimus

Y-DNA tutkimuksiin liittyviä periaatteita ja termejä 

Helpoin yleistietolähde tietokoneen käyttäjille on lyhyt yhteenveto osoitteen http://www.fidna.info tiedostossa ”Mistä suomalaiset ovat tulleet”.  Seuraavassa on koottu suomeksi perusteita sekä yleistiedon lukijoille, että erityisesti FTDNA tutkimustuloksia tarkasteleville.   

DNA-tutkimuksia on monenlaisia ja vain osa niistä liittyy sukututkimukseen lähinnä populaatioiden genetiikkana (ryhmien vertailuna).  Erityisesti on korostettava DNA-sukututkimuksen keskittyvän vain sukulaisuuden ja sukujuurien tutkimiseen, ei lainkaan geneettisiin ominaisuuksiin.

  • Tarkkaa DNA-vastaavuutta käytetään lähinnä vain poliisityössä ja tällaista tietoa on vain viranomaisten käytettävissä (enemmän näytevertailuna kuin rekistereinä).
  • Koko DNAn rakenneosien vertailu eri ihmisryhmien tyypillisiin DNA-ketjuihin perustuen kertoo, miten paljon henkilössä on intiaania, latinalaista, germaania, slaavia, mustaa afrikkalaista, arabia, intialaista, kiinalaista yms.  Tämä amerikkalaisten jonkin verran käyttämä tapa on kallis ja varsin karkea, eikä ole oikein relevantti Euroopassa.
  • Y-DNA tutkimus perustuu miesten Y-kromosomin periytymiseen vain isältä, sen muuttumiseen vain harvoin tapahtuvien mutaatioiden kautta ja mutaatioketjun periytymiseen edelleen. Sama tai lähes sama markkereista koostuva haploryhmä kertoo varmuudella yhteisen esi-isän olemassaolon.  Koska mutaatiovauhti voidaan vain karkeasti arvioida, niin ”veljeshaarojen” haarautumisaika on myös vain todennäköisyyslaskentaan perustuva likiarvio.  Lisäämällä markkereiden määrää ja henkilölukua vertailtavissa ryhmissä hajontaa voidaan kuitenkin vahvasti pienentää
  • Solun aineenvaihduntaa ohjaava mitokondrio periytyy vain äidiltä (myös miehille) ja muuntuu vain hitaasti mutaatioin, joten sen avulla voidaan vastaavasti selvittää henkilön äitilinjaa.  Äitilinjojen kehittyminen on yleislinjoiltaan selvitelty varsin hyvin, mutta koska sukututkimus on pääosin nimenkantajiin perustuvaa mieslinjojen tarkastelua, niin sukuaineistoissa tätä tietoa on vähän.

Sen paremmin isälinjan Y-kromosomi (haploryhmä) kuin äitilinjan mitokondrio eivät ole mitenkään ratkaisevia ihmisen varsinaisissa perinnöllisissä ominaisuuksissa.  Ehkä isälinjalla on vähän enemmän merkitystä kulttuurissamme, koska sukuyhteisö pysyy koossa isälinjan ympärillä (vaimot tulevat ja tyttäret menevät) ja perimässä on paljon tämän perusyhteisön sisäistä takaisin-kytkentää.  Nämä kaksi solun osaa vain sattuvat muuttumattomina sopimaan erinomaisesti esivanhempien puhtaiden äärilinjojen selvittelyyn.

Geneettisen perimän kaikki tärkeimmät tekijät syntyvät 22 autosomisen kromosomiparikin yhdistyessä molemmilta vanhemmilta puoliksi saatuja perintötekijöitä sekoittamalla ja ”osia meioosissa arpomalla”.    Tarjolla olevista ”rakennuspalikoista” valikoituu käyttöön vain pieni osa, paljon enemmän puhtaan sattuman kuin todellisen paremmuusvalinnan tuloksena.  Geeniperimä putkahtelee suvuissa näkyviin monella tavoin, mutta sattumanvaraisesti.  Sukukirjassamme mainittu ”perimän määrittelee lähikylien yhteisö viimeisten parinsadan vuoden ajalta” pitää edelleen vahvasti paikkansa, koska kaikki sekoittuu vuosisatojen saatossa.

Geneettinen kehitys ei ole selkeä kehittymisprosessi, se on satunnaisprosessia parhaimmillaan sumean logiikan periaatteella.  Tulevaisuutta ei voi lainkaan ennustaa, menneisyys on kuin veden virtaus tasangolla, rinnakkaisia haaroja kaikkialla ja vain sattuma ratkaisee miten niistä muodostuu päävirtaussuuntia (joista äärimmäisen harvoin voi muodostua suuri päävirta jonkin erityisen edullisen mutaation tai paikallisen tekijän tehdessä jonkin haaran kilpailukyvyn ylivertaiseksi).

Lisäksi ihmisen ominaisuuksia määrittää erittäin vahvasti kulttuuriperimä, minkä ratkaisevat tekijät ovat koko suvun ja lähikylien yhteisöt.  Läheskään kaikki ei riipu geeneistä.

Yleiskommenttina on lisäksi todettava, että suurissakin rekistereissä olevat tiedot ovat vain satunnaisia näytteitä ihmisten suuresta määrästä.  Kahden ihmisen lähiosuma varmistaa heidän yhteisen esi-isänsä olemassaolon, mutta tällöin ei saa vielä vakuuttua heidän oletettujen sukujensa ”veljeydestä”.  Jompikumpi on voinut tulla ”väärän koivun takaa”.  Vasta muutama näyte eri haaroista sukua antaa varmuuden, että näyte varmasti edustaa sukua, eikä ulkopuolista geenien lahjoittajaa.

Nykyiset tietokannat ovat enemmän satunnaisnäytteitä kuin tilastollista otosta.  FTDNA tuloksia on Suomesta vasta noin 1200 tasolla Y12 (12 markkerilla), noin 400/Y25 ja noin 200 tasolla Y67.  Siten suurimmasta osasta keskisuuriakaan sukuja ei ole vielä yhtään näytettä missään rekisterissä.

Tietomäärien kasvaessa ”veljeshaarojen” määrä tullee nykyisestä moninkertaistumaan.  ”Monet ovat veljiä keskenään”, koska väkilukummekin on pääosin samoista esi-isistä kasvanut suuruusluokkaa 300-kertaiseksi noin kymmenessä vuosisadassa.   

Tärkeimpiä periaatteita Y-DNA sukututkimuksessa

Sukulaisuustieto saadaan vain vertailuina joko suvun sisällä tai laajemmin tietokoneen tekeminä vertailuina laajoissa rekistereissä, kuten FamilyTree organisaation yli 140 000 jo olemassa olevaa tutkimustulosta.  Tällöin saadaan kuvaa suhteista muihin sukuhaaroihin Suomessa ja naapurimaissa.

Yksittäisen henkilön tai sukuryhmän Y-DNA tieto yksinään kertoo varsin vähän, vaikka se olisi tehty äärimmäisen perusteellisesti haploryhmän tarkkaan määritykseen saakka (DeepClad).  Toki tuo tieto yhdessä alan kirjallisuuden kanssa (Suomessa ehkä parhaiten Kalevi Wiikin julkaisut) mahdollistaa yleiskuvan suvun juurista.  Sukulaisuuden läheisyydestä ei näin saada mitään tietoa.   

Aika-arvioiden teko ”veljeshaarojen” haarautumisen suhteenon epätarkkaa ja niiden tukena tulisikin käyttää muuta yleistietoa kansojen ja ihmisryhmien vaelluksesta (yhden sukuhaaran puitteissa yksityinen esi-isä on voinut kulkeutua kauaskin sattumalta).  Varsinkin pienillä markkerimäärillä mutaatioiden sattumanvaraisuuden lisäksi tulee tarkasteluun helposti perusteellinen virhe tulosten käsittelyn vääristymänä.   Tiedostoissa ”Matches”, ”Maps” ja ”Recent Ancestral Origins” tulevat näkyviin vain vähän mutatoituneet ääritapaukset näennäisinä lähiosumina, mitkä edustavat huonosti koko kyseistä sukuhaaraa.  

Erityisesti Y12 (12 markkeria) on täysin kelvoton aika-arvioille, vaikka paljastaakin yhteisen esi-isän.  Täysosumakin (tai usea) on mahdollista suuresta tulosjoukosta jopa reilusti 100 sukupolven jälkeen.  Vain ryhmiä vertailtaessa ja suurella markkerimäärällä saadaan jonkinlainen aika-arvio, kun kaikki näytteet ovat mukana ja vertailu perustuu koko joukon keskiarvoihin.

Tärkeimpiä termejä Y-DNA sukututkimuksessa

Alleeli on DYS-markkerin mutaatiotyyppi (1-n), joita on yleensä rajallinen määrä (alle parikymmentä).  Geneettisesti merkittävän mutaation kohdalla myös DYS-markkeri voidaan muuttaa.  Lähisukulaisilla alleelit ovat usein ”vierekkäisiä” tyyppejä (uusi tyyppi saa lähimmän vapaan numeron).

DYS on markkerin tyyppitunnus (satoja erilaisia) ja sillä voi olla useita mutaatioita (alleelit) DYS is short for D NA Y-chromosome S egment, and is used to designate a segment of DNA on the Y chromosome where a sequence of nucleotides repeats. These sequences are known as short tandem repeats (STRs), and are called markers in genealogical DNA testing. The possible variations of repeats at a DYS marker are known as alleles.  

Haplo Tree FTDNA tiedostossa kertoo haplotyypin kehittymispolusta.  Tuo kaavamainen puu on karkeasti yksinkertaistettu, oikeampi olisi verhokäyrästö minkä sisällä ihmisryhmän yksilöillä tapahtuu eri järjestyksessä sattumanvaraisia mutaatioita.  Suku kehittyy vähän kuin porolauman kulku tunturilla, kymmeniä polkuja lavealti ja leveälti joukon kuuitenkin pysyessä yhtenäisenä ja suuntautuessa samaan osoitteeseen. 

Haploryhmä määritellään koetuloksista niiden yleisimpien DYS-markkereiden perusteella noin 10-15 valitun markkerin ja niiden alleelien avulla (useimmat näistä ovat hitaasti muuttuvia tyyppejä).  Tämä DYS-joukko pysyy yleensä samana (tai lähes) haploryhmässä ja alahaaroissakin ainakin useita kymmeniä sukupolvia (jopa satoja), mutta alleelit muuttuvat.  Tutkimustuloksia käsiteltäessä ja vertailtaessa samanlaiset haploryhmät on nimetty kirjainnumeroyhdistelmillä, mikä samalla kuvaa ryhmän alleelien kehitystä (esimerkiksi ketju I, I1, I1a, I1a1).  Koska alleelien mutaatiot ovat satunnaisia, niin kehityskin on verkkomainen yleissuunta, ei selkeä polku.  Sattumaero ”tärkeänäkin tunnuksena” pidetyssä DYS-markkerissa ei yksinään todista mitään erisukuisuutta, vielä vähemmän erot muissa markkereissa.  Haploryhmien tunnukset muuttuilevat alan tutkijoiden käsissä ja eri julkaisuissa, näin varmistaen satunnaisen lukijan varman sekaantumisen.

Haplotyyppi on alaryhmä (kuten I1a-Bothnia tai N3-Laatokka) yleensä jo yhden maan sisällä. Useimmiten tyyppi on syntynyt 1000-2000 vuotta (35-70 sukupolvea) sitten, joten siihen kuuluu  yleensä varsin suuri joukko erinimisiä sukuja.  Kuten haplopuu, niin tyypinkin DYS-alleelien määrittely (kuten esimerkiksi Lappalainen tai Nordvedt) on karkea yksinkertaistus.  Samassa sukuhaarassakin voi olla sattumapoikkeamia, eivätkä en tällöin merkitse mitään. 

Kansallisuutta tai heimoa ei voi määrittää haploryhmien avulla, koska ”puhdasta” ihmisryhmää ei ole juuri missään.  Kukin kansanryhmä koostuu aina muutamasta päähaploryhmästä (kuten Suomessa N3, I1a, R1a1 ja R1b) ja monista pienryhmistä. 

Locus (sijaintitunnus) on henkilön testitulosten DYS-markkerin yleisyysanalyysin perusteella määräytyvä sijainti (järjestys 1-n) testituloksissa, mikä vaihtelee henkilöittäin vaikka haploryhmä on sama.  Valtaosa ao pääryhmän (kuten N tai I) sisäisen kehityksen tarkastelussa käytetyistä markkereista löytyy parinkymmenen ensimmäisen joukossa.

Maps on karttakuvaus tutkittujen henkilöiden ilmoittamista esi-isien kotipaikoista.  Tämä on hyvin karkeaa tietoa, useimmat osaavat kertoa vain muutamia sukupolvia taaksepäin, enintään kymmenkunta.  Lippukartta kertookin lähinnä vain, mihin ao sukuhaara oli vaeltanut 3-10 sukupolvea sitten (amerikkalaisista monet eivät tiedä sukunsa lähtömaatakaan).  Yli 25 markkerin tuloksia on kuitenkin niin vähän, että lippujen olemassaolo eri puolilla maailmaa on lähinnä vain sattumaa.

Markkeriksi kutsutaan DYS-tyyppiä (ja sen alleelia), mikä Y-kromosomin toistuvien DNA-jaksojen perusteella valikoituu yleisyysanalyysissä kunkin mieshenkilön tärkeimpien isälinjaa määrittelevien  DYSien joukkoon.  Erilaisillakin haploryhmillä on useimmiten osa samoja markkereita.  Markkerissa ei ole geenejä, joten niihin ei liity perinnöllisiä ominaisuuksia.  Täten markkerin ainoa ”tärkeysarvo” tulee sen määrittelyarvosta isälinja-analyysissä. 

Mutaation keskimääräinen todennäköisyys on keskimäärin noin 3/1000 yhtä markkeria kohti sukupolvessa, mutta keskimääräisyyskin vaihtelee satunnaisesti ainakin välillä 2-4/1000 eri DYS-tyypeillä.  Yksittäinen mutaatio on vielä enemmän satunnaissuure, joten yhden mutaation ero voi olla jo isän ja pojan välillä, mutta 12 markkerin tutkimuksessa yhdessä isälinjassa 10 prosenttia on vielä muuttumattomia noin 40 sukupolven jälkeen ja 1 prosentti noin 70 sukupolven jälkeen.  Useamman markkerin tutkimuksessa näkyy mutaatioita useammin ja yhteishajonnassa sattuman vaikutus tasoittuu voimakkaasti.  Täten erottelukyky paranee vahvasti; 25 markkerilla 10 prosenttia on muuttumattomia noin 12 sukupolven jälkeen ja vain 1 prosentti on muuttumattomia 25 sukupolven jälkeen.  Vielä suuremmilla markkerimäärillä (kuten DNA67) voidaan mutaatioiden määrän perusteella arvioida jo haarautuman ajankohdan suuruusluokkaa sukupolvina. 

Recent ancestral origins kertoo lippukarttaa vastaten missä maissa samaan tai läheiseen haploryhmään kuuluvia löytyy.  Tärkein indikaattori tässä taulukossa on saman haploryhmän prosentuaalinen osuus.  Mutaatioiden määrästä voi lisäksi hyvin karkeasti arvioida ao ”veljesryhmän” haarautumisaikaa kun markkerimäärä on vähintään 25.  Useimmiten paremman aika-arvion saa kuitenkin yleisestä asutuksen ja siirtolaisuuden kehittymishistoriasta, josta löytyy paljon pätevää kirjallisuutta.

Y-DNA matches (FamilyTree)kertoo ”osumat” muihin koetuloksiin eli henkilöt joilla on sama tai muutamalla erilaisella alleelilla poikkeava haploryhmä.   Kaikkien näiden kanssa on olemassa yhteinen esi-isä, mutta sukupolvien määrä tähän voi olla hyvinkin suuri.  Täysosumakin voi markkerimäärällä Y12 merkitä sukupolvia suuruusluokkaan yli 100 saakka, mutta määrällä Y25 yleensä alle 30 ja määrällä Y67 yleensä alle 10 sukupolvea.  Ajallista tarkkuutta haluttaessa markkereiden määrän lisäys on siten erittäin tehokas keino.  Hajontaa voidaan edelleen pienentää ottamalla molemmista vertailtavista ryhmistä 2-3 näytettä (mielellään kummankin keskenään mahdollisimman kaukaisista sukuhaaroista, koska vain ketjujen erillisyyden aika vähentää hajontaa). Todellisuudessa kaukanakin olevat suvut näyttävät olevan lähellä, jos yksilöiden mutaatiot ovat tuoneet heitä näennäisesti lähemmäksi toisiaan. 

Laatinut Martti T Määttänen