Suomalaisten geneettiset isälinjat
19.9.2008
(HUOM! Tänä vuonna muutettiin jälleen suomalaisten yleisimmän isälinjan merkintää, mutta ymmärrettävyyden
vuoksi käytän siitä edelleen nimitystä N3. Sen aiempia nimityksiä ovat haploryhmä (eli Hg) 16 ja Tat-C.)
En ole tarjonnut tällä sivustolla juurikaan varsinaisia tuloksia alkuperän osa-alueita tutkivilta tieteiltä,
joten nyt on korkea aika selventää, mistä oikein puhutaan.
Nykyään geenejä tutkitaan siis yhä enenevässä määrin toisvanhempaisten (osuva käännös Kalevi Wiikin)
geenilinjojen kautta. Äitilinjoja tutkitaan mitokondriaalisesta DNA:sta ja isälinjoja Y-kromosomaalisesta
DNA:sta. Näitä suositaan siksi, että niillä saavutetaan suurempi aikasyvyys kuin tutkimalla tuman DNA:ta,
joka periytyy molemmilta vanhemmilta ja sekoittuu siksi nopeasti.
Keskityn geenien osalta aluksi isälinjoihin, koska niillä näyttää olevan parempi korrelaatio kielikuntiin kuin
äitilinjoilla, ainakin puhuttaessa Euraasian laaja-alaisista kielikunnista (uralilainen, indoeurooppalainen ja
turkkilainen). Tämä merkitsee sitä, että isälinjoilla on kielikuntien tapaan laaja levinneisyys
itä–länsi-suunnassa, kun taas äitilinjojen levinneisyys näyttää pääsääntöisesti pohjois–etelä-suuntaiselta.
Äitilinjat saattaisivatkin korreloida paremmin Euroopan varhaisempien kielten kanssa, eli esimerkiksi
Pohjois-Euroopan alkuasuttajien kielten kanssa, joista tosin yksikään ei valitettavasti ole säilynyt
(vaikka kielellinen substraatti onkin eristetty esim. saamesta; yritän valmistella sivun aiheesta).
Tätä kytköstä näyttäisi tukevan se, että mainitut laaja-alaiset kielikunnat ovat kaikki levittäytyneet
vasta karkeasti vuoden 4000 eaa. jälkeen ja että isälinjojen ikäyksiä on koko ajan pyritty nuorentamaan.
Vastaavasti paleoeurooppalaiset kielet (nykyään siis kadonneet) edustavat paljon vanhempaa tilannetta:
niiden ekspansio alkoi jääkauden päättyessä karkeasti 10 000 vuotta eaa., ja äitilinjojen ikäys onkin
paljon vanhempi kuin isälinjojen: erot ovat jopa kymmeniä tuhansia vuosia.
Kun geenilinjaa (toisvanhempainen haploryhmä) iätään, iätään oikeastaan haploryhmän alkupiste, eli hetki
ennen tytärmutaatioiden (joista muodostuvat haploryhmän haplotyypit) syntyä. Ja mitä suurempi määrä ihmisiä
syntyy (eli mitä laajemmalle geenilinja leviää), sitä useammin syntyy mutaatioita, jotka säilyvät nykypäivään.
Niinpä vanhempi ikäys merkitsee, että geenilinjan ekspansio on tapahtunut aikaisemmin, ja nuorempi ikäys
merkitsee, että geenilinjan ekspansio on tapahtunut myöhemmin.
Suomalaisten isälinjoista
Suomalaisia ei ole mielekästä käsitellä yhtenä väestönä, koska isälinjojen esiintymistaajuudet (frekvenssit)
vaihtelevat eri puolilla maata. Usein erotetaan perustellusti toisistaan länsi- ja itäsuomalaiset, ja
seuraavassa noudatan tätä karkeaa jakoa.
Isälinjat yleisyyden mukaan (Y-DNA):
(Lappalainen et al. 2008: ”Migration Waves to the Baltic Sea Region.” – Annals of Human Genetics 2008.)
Länsisuomalaiset (230 miestä)
N3 = 41,3 % (= N1c)
I1a = 40,0 % (= I1)
R1a1 = 8,7 %
R1b = 5,2 %
DE = 0,9 %
I1c = 0,9 %
N2 = 0,9 % (= N1b)
Y* = 0,4 % (xC,DE,F)
C = 0,4 %
F = 0,4 % (xI,J,K)
I1b = 0,4 %
N* = 0,4 % (xN2,N3)
Itäsuomalaiset (306 miestä)
N3 = 70,9 %
I1a = 19,0 %
R1a1 = 5,9 %
R1b = 2,6 %
I1c = 0,7 %
F = 0,3 % (xI,J,K)
Q = 0,3 %
R* = 0,3 % (xR1a,R1b)
(Lappalainen et al. 2008)
Suomalaisilta tavataan siis kaikkiaan neljäätoista eri isälinjaa, joista neljä on suurta ja joista kymmenen taajuus
on alle prosentin. Viime aikoina linjojen tulosuuntiin on löydetty tarkennuksia. Vallitseva N3 on kiistatta
peräisin idästä, ja viimeisimmän käsityksen mukaan se on levinnyt Aasian puolelta (eli Ural-vuoriston ja
Kaspianmeren itäpuolelta). Tämä linja koostuu oikeastaan kahdesta aallosta: varhaisempi N3a1 on levinnyt
laajemmalle ja sitä tavataan esimerkiksi slovakeilta ja ukrainalaisilta saakka, kun taas nuorempi N3a2
on keskittynyt Euroopan puolella Keski-Volgan uralin- ja turkinkielisille, ja lännessä sen frekvenssi
putoaa jyrkästi vepsäläisten länsipuolella. Kumpaakin alalinjaa tavataan myös Siperiassa, eli kumpikin
on kokenut hyvin mittavan leviämisen.
N3:n eräs keskittymä löytyy Itä-Siperian jakuuteilta, jotka puhuvat turkkilaiseen kielikuntaan kuuluvaa
kieltä. Näyttäisi siltä, että jakuutit eivät ole ainakaan isälinjojen osalta kovinkaan paljon assimiloineet
itseensä alueen alkuperäisempää väestöä, jota vielä edustavat jukagiirit (ks. Pakendorf et al. 2006). N3
näyttääkin tulleen alueelle Sajan-vuoriston suunnalta, mistä turkkilainen kielikin. Kuitenkin N3:a tavataan
myös aivan Siperian itäisimmistä osista.
I1a:n tulosuunta on sen sijaan jossain määrin kiistanalainen. Lähteenä käyttämäni tutkimuksen (Lappalainen
et al. 2008) mukaan länsisuomalaisten I1a muistuttaa ruotsalaista ja itäsuomalaisten baltialaista. Tämä
isälinja lieneekin kiertänyt Suomeen kahden puolen Itämerta. I1a on yleinen Itämeren rantojen
germaaninkielisillä kansoilla, mutta sitä tavataan ainakin Volgan mutkaan saakka. Sitä on runsaasti
myös saamelaisilla.
R1a1 on myös tulosuunnaltaan hieman kiistanalainen. Itse linja esiintyy Euroopassa taajimpana itäisen
Euroopan slaaveilla, mutta sitä on runsaasti myös Skandinaviassa. Tutkimuksen Lappalainen et al. (2008)
mukaan suomalaisten R1a1 muistuttaa kuitenkin enemmän keskieurooppalaista kuin slaavilaista R1a1:tä.
R1b:tä puolestaan pidetään yleisesti läntisenä linjana, mutta kuitenkin sitä tavataan idässä vielä
länsisiperialaisilta kansoiltakin. Ilman tarkempia tutkimuksia on mahdotonta sanoa, mistä ja mitä kautta
tämä linja on Suomeen tullut. Teoriassa on mahdollista, että kaikki kolme viimemainittua isälinjaa, I1a,
R1a1 ja R1b, olisivat levinneet Suomeen kahdelta suunnalta, lounaasta ja kaakosta.
Monet suomalaisten marginaalisista isälinjoista ovat paljon yleisempiä etelämpänä Euroopassa, mutta joitain
eksoottisempiakin linjoja joukkoon mahtuu. Y* (xC,DE,F; x = poislukien) on joko A tai B (näiden
tunnusmerkkejä ei tutkimuksessa erikseen testattu), jotka molemmat ovat afrikkalaisiin väestöihin
rajoittuvia isälinjoja.
C on syntynyt pian ensimmäisten nykyihmisten lähdettyä Afrikasta, ja sen alalinjoja tavataan laajalti
Aasiassa muttei juurikaan Euroopassa. N* esiintyy lähinnä Altain ja Pohjois-Kiinan alueella, ja N2 on
yleinen samojedeilla, ulottuen lännessä saarekkeisena Keski-Volgalle ja vepsäläisten alueelle asti. Q
on aasialainen linja, mutta se on taajaan edustettuna myös Amerikan intiaaneilla.
Mielenkiintoista kyllä, selvästi aasialaisia isälinjoja C ja Q ei ole tavattu Länsi-Siperian hanteilta
(ostjakeilta), vaikka suomalaisiin asti näitä on päätynyt. Selitys voisi olla niinkin myöhäinen kuin Venäjän
vallan aikainen tataarivaikutus. Suomessa on edelleen elinvoimainen tataarivähemmistö, ja Keski-Volgan
turkkilaisilla kansoilla tataareilla, baškiireilla ja tšuvasseilla isälinjoja C ja Q tavataan pieninä
pitoisuuksina. Hantit puolestaan lienevät aikaisemmin asuneet Uralin länsipuolella, ja Uralin ylitys on
tapahtunut huomattavasti pohjoisempana kuin turkkilaisilla kansoilla ylitys toiseen suuntaan (idästä
länteen). Hantit ovat siis hyvinkin saattaneet välttää suorat kontaktit turkkilaisiin, vaikka Siperiassa
Obia ylävirtaan (kaakkoon) seuratessaan he ovatkin jälleen päätyneet lähemmäs turkkilaisia kansoja.
Mistä ja milloin kaikki nämä isälinjat ovat Suomeen tulleet? Siihen on vaikea vastata mitään varmaa.
Mainitut aasialaiset linjat voisivat teoriassa olla myöhäisimmillään vasta tataarien mukana Venäjältä
Suomeen tulleita. Entäpä afrikkalaiset isälinjat? Ei aavistustakaan. Aivan viime sukupolvien aikana
saapuneista tulokkaista ei voi olla kysymys, koska geenitutkimuksiin valitaan sukutaustaltaan ”puhtaita”
suomalaisia, jotka eivät ole sukua toisilleen.
Mihin haluamme vastauksia?
Viime vuosina, kun on haluttu vastata kysymykseen mistä suomalaiset ovat tulleet, on yleensä kerrottu
koko nykyihmisen historia Afrikasta Aasian kautta Eurooppaan. Jääkauden maksimin aikaisia refugioita
(pakoalueita, talvehtimiskeskuksia) on myös korostettu ehkä liikaakin. Etnohistorian kannalta ei nimittäin
ole suurtakaan merkitystä sillä, ovatko jonkin geenilinjan kantajien esivanhemmat kulkeneet Intiassa rannikon
vai sisämaan kautta, eikä sillä, ovatko he talvehtineet jääkaudella Iberiassa (Espanjassa) vai Ukrainassa.
Tärkeintä olisi kuitenkin saada tietää, milloin ja mitä kautta (ja keiden kanssa) ihmiset ovat tulleet
nykyisen Suomen alueelle. Vain tällä asialla on merkitystä esimerkiksi silloin, kun pohditaan Suomen
kielellistä uralilaistumista. Ensin on selvitettävä lähialueet ja lähimenneisyys, minkä jälkeen vasta
voidaan rakennella spekulaatioita kaukaisemmista alueista ja ajanjaksoista. Muuten perusta jää hyvin
hataraksi, ikään kuin kavuttaisiin peräpuoli edellä puuhun.
Korostan jälleen, että tarkentuva haplotyyppianalyysi saattaa muuttaa hyvinkin radikaalisti jo varmoiksi
oletettuja kytköksiä. Jos esimerkiksi jokin sellainen geenilinja, jota on pidetty lännestä tulleena ja
joka siksi on yhdistetty vaikkapa germaanivaikutukseen Suomessa, selviääkin idän kautta tänne tulleeksi,
katkeaa sen yhteys germaaneihin. Silloin on etsittävä jokin uusi linja edustamaan germaaneja, ja tästä
saattaa seurata, että myös suomen kielen tuojaksi oletettu linja menee uusiksi.
Puhumattakaan siitä, että kielitieteen kentilläkin kuohuu: suomen kielen esimuodon saapumista Suomeen on
viime vuosina haluttu myöhentää. Jos kielen saapumisen aika ja suunta muuttuvat, katkeaa myös yhteys
tiettyyn aikaan tietystä suunnasta tulleeseen geenilinjaan. Siksi onkin visusti vältettävä kielelliseen
identiteettiin perustuvien nimilappujen länttäämistä geenilinjoihin.
Ei siis kannata puhua suomalaisesta, saamelaisesta, germaanisesta tai slaavilaisesta geenilinjasta:
useimpia geenilinjoja on näillä kaikilla, ja jonkin linjan korkea esiintymistaajuus voi johtua yhtä
hyvin ajautumis- tai pullonkaulailmiöistä kuin siitä, että kyseinen geenilinja jotenkin kiinteästi
liittyisi juuri siihen kielilinjaan, jota puhuvalla väestöllä sitä esiintyy. Esimerkiksi nimitys
”saamelaismotiivi” saattaa erehdyttää ajattelemaan, että äitilinja U5b1b1 olisi levinnyt Lapista
etelään eli saamelaisilta naapurikansoille, vaikka prosessi on todennäköisimmin ollut juuri päinvastainen
(koska väkipaine on aina ollut etelästä harvaanasutun pohjoisen suuntaan) ja linja on vain sattunut
rikastumaan pohjoisessa, missä myöhäisemmät tulokaslinjat eivät ole syrjäyttäneet sitä niin kuin etelässä.
Alkuperätutkimus onkin jatkuvasti muuttuva palapeli, jossa on otettava huomioon olennaiset eri näkemysten
perusteluihin vaikuttavat muutokset tutkimustilanteessa. Ja tietysti jätettävä huomiotta sellaiset muutokset,
joilla ei todellisuudessa olekaan vaikutusta asiaan, vaikka joku saattaa toisin uskoakin.
Ovatko suomalaiset itäisiä?
Aiemmin olen nimennyt muutamia geenilinjoja itäisiksi – ovatko suomalaiset siis sittenkin mongoleja?
Vallitsevan isälinjan itäisyydellä ei ole mitään tekemistä mongolisuuden kanssa, koska mongolipiirteet
eivät ole sidoksissa mihinkään toisvanhempaiseen linjaan. Tästä syystä samaa isälinjaa edustavat miehet
ovat hyvinkin erinäköisiä: suomalainen N3-mies näyttää enemmän suomalaiselta I1a-mieheltä kuin
jakutialaiselta N3-mieheltä.
Tvärminnen juurisymposiumissa 1980 heitettiin arvio, että suomalaisten geeniperimästä 25 % on itäistä
perua. Karkeasti laskien tämä pitää edelleen paikkansa: jos naiset ovat ”eurooppalaisia” tai ”läntisiä”
ja puolet miehistä ”itäisiä”, niin sehän merkitsee neljäsosan suomalaisista olevan itäistä alkuperää.
Vaikka isä- ja äitilinjat paljastavat vain pienen murto-osan suorista esivanhemmistamme, voitaneen olettaa
niiden loppujen esivanhempiemme paljastuvan kaikkien muiden suomalaisten isä- ja äitilinjoista.
Sitä paitsi ”itäisyys” on käypä käsite vain suhteessa muihin eurooppalaisiin. Koska myös indoeurooppalaista
kieltä puhuvilla liettualaisilla on korkea N3-taajuus, he ovat yhtä ”itäisiä” kuin suomalaiset. Etelämpänä
Euroopassa on myös paljon aasialaisia geenilinjoja, mutta koska ne ovat tulleet Lähi-idästä, niillä ei ole
taakkanaan mongolimielleyhtymiä.
Kielet
Isälinjoista juuri N3 on haluttu liittää uralilaiseen kieleen, mutta se ei suinkaan ole ainoa vaihtoehto.
Sitä paitsi eräiltä samojedikansoilta tätä linjaa ei ole lainkaan löydetty. Useimmilta uralilaisilta
kansoilta tavataan myös isälinjoja R1a ja R1b, jotka myös voisivat liittyä uralilaisen kielen leviämiseen.
Eräs mahdollisuus on myös N2, joka on samojedeilla ja Keski-Volgan kansoilla erittäin yleinen ja jota vielä
suomen lähisukukielen vepsän puhujilta tavataan 18 % verran. On myös esitetty, että kantasuomen
(itämerensuomen) syntyalue ja leviämiskeskus osuisi juuri tälle alueelle, Äänisen eteläpuolelle.
N2 olisi siis tuonut alueelle uralilaisen kielen, mutta pitkän ja vakaan kantasuomalaisen kehityskauden
aikana linjan pitoisuus olisi laimentunut niin että Suomeen ja Viroon sitä on tullut enää alle prosentti
(tai tarkemmin: sitä on nykyään enää alle prosentti).
Tällainen etappiekspansio – jossa kieli leviää vaiheittain ja leviämisvaiheiden välissä on pitkiä
leviämättömyyden kausia, jolloin geenipooli saa uutta verta, minkä seurauksena seuraavassa vaiheessa
pääasiallinen kielenlevittäjä onkin eri geenilinja kuin edellisessä vaiheessa – on oikeastaan ainoa
mahdollisuus uralilaisen kielikunnan kohdalla: mitään isälinjaahan ei tavata kaikilta uralilaisilta
kansoilta (olettaen että kieli on levinnyt juuri isälinjan mukana). Leviäminen koko nykyiselle
valtavalle puhuma-alueelle ei siis ole voinut tapahtua kertarysäyksellä. Ja tietysti historiallisestikin
tiedetään, että pohjoisimmille alueille itämerensuomi, samojedi ja komi ovat levinneet vasta myöhään.
Ongelmana ovat oikeastaan vain kielikunnan periferiat, lännessä itämerensuomi ja saame ja idässä samojedi,
joiden leviäminen nykyiseen laajuuteensa on vaatinut selvästi useampia vaiheita kuin kielikunnan keskustassa
(siellä kuuluisassa Volgan mutkassa), missä voidaan olettaa esimerkiksi udmurttia puhutun ”aina”
(siis kantauralista lähtien) samalla alueella. Mahdollisuuksia on oikeastaan kaksi: joko uralilaista
kieltä on alkuaan levittänyt N3, jolloin samojedikielten myöhempi ekspansio Sajanilta pohjoiseen on
tapahtunut esimerkiksi N2:n kantamana; tai uralilaista kieltä on alkuaan levittänyt N2, jolloin
itämerensuomen ja saamen leviäminen Äänisen ympäristöstä länteen ja pohjoiseen on tapahtunut esimerkiksi
N3:n kantamana.
Derenko M, Malyarchuk B, Denisova G, Wozniak M, Grzybowski T, Dambueva I, Zakharov I:
”Y-chromosome haplogroup N dispersals from South Siberia to Europe.” – Journal of Human Genetics, 2007.
Ingman, Max & Gyllensten, Ulf:
”A recent genetic link between Sami and the Volga-Ural region of Russia.” – European Journal of Human Genetics, 2007.
Lappalainen T, Laitinen V, Salmela E, Andersen P, Huoponen K, Savontaus M.-L, Lahermo P:
”Migration Waves to the Baltic Sea Region.” – Annals of Human Genetics, 2008.
Takaisin pääsivulle
|