genomi

Biologisten mekanismien alkulähteillä

Bioinformaatikot etsivät kehittynein laskennallisin menetelmin signaaleja mittalaitteiden tuottamista jättimäisistä tietomassoista.

Bioinformatiikka pyrkii ratkaisemaan biotieteiden ongelmia ja ymmärtämään biologisia järjestelmiä hyödyntämällä matematiikan, tietojenkäsittelyn ja tilastotieteen menetelmiä. Laskennan rooli on 1980-luvulta alkaen kasvanut biotieteissä erityisesti geenitutkimuksen tuottamien jättimäisten tietomassojen myötä, vaikka sitä sovelletaan kaikenlaisen muunkin kliinisen mittaustiedon analysointiin.

Tutkimuksen keskiössä ovat terveydenhoidon sovellukset ja ihmisen perimä. Bioinformatiikkaa hyödynnetään kuitenkin myös biopohjaisia materiaaleja käyttävässä teollisuudessa, ympäristötutkimuksessa, kasvinjalostuksessa ja kaikenlaisten biologisten aineistojen analysoinnissa.

Alaa voi opiskella Aalto-yliopiston ohella Turussa, Tampereella, Kuopiossa ja Helsingin yliopistossa. Aallossa ja Helsingissä ohjelmat ovat laskentapainotteisia, muualla maassa lähestymistapa on soveltavampi ja lähdetään biotieteistä. 

Ihmisen koko ekosysteemi

Millaisia kysymyksenasetteluja laskennallisilla työ­kaluilla voi tehdä genomitutkimuksessa?

– Tunnetuin ongelma on yksilön genotyypin määritys eli tutkitaan, miten perimä eroaa yksilöiden välillä ja miten se voi vaikuttaa sairauksien puhkeamiseen, Professori Harri Lähdesmäki Aalto-yliopistosta kertoo. 

Harri Lähdesmäki muistuttaa, että ihmispopulaatio on heterogeeninen. Ihmisten elintavat ja elinympäristö suoliston mikrobeja myöten ovat nekin hyvin erilaisia.
lahdesmaki

– Tietoa voidaan saada myös siitä, mitkä ihmisen geeneistä ovat aktiivisia missäkin kudos- ja solutyypissä ja miten joidenkin geenien ilmeneminen eroaa ihmisten välillä, esimerkiksi terveiden ja sairaiden yksilöiden välillä. Ja tietysti voidaan myös tutkia, miten perimän erot vaikuttavat geenien ilmenemiseen ja miten tämä kaikki kytkeytyy ympäristötekijöihin ja elintapatietoihin.

Lähdesmäki on yhteistyössä lääkärien kanssa tutkinut geneettisten tietojen lisäksi myös muita selittäviä tekijöitä sairauksien puhkeamiseen – esimerkiksi sitä, kasvattaisivatko esimerkiksi tietyt ympäristötekijät tietyn yksilön riskiä. Viime aikoina kohteeksi ovat myös nousseet yksilöiden epigeneettiset muutokset, jotka liittyvät ympäristötekijöiden vaikutukseen geeneihin ja vaikuttavat niiden ilmenemiseen, mutta jotka eivät muokkaa itse geenejä.

Tautien alkulähteillä

Lähdesmäki on tutkinut muun muassa erilaisia autoimmuunitauteja, kuten ykköstyypin diabetesta.

– Meillä on ollut todella visionäärisiä lääkäreitä, jotka ovat ymmärtäneet ottaa 90-luvun puolivälistä alkaen säännöllisiä näytesarjoja lapsista, joilla oli todettu geneettinen riski sairastua diabetekseen. Nyt olemme analysoineet näitä näytteitä moderneilla työkaluilla ja saaneet ehjiä aikasarjoja syntymästä taudin puhkeamiseen, Lähdesmäki kuvaa.

– Olemme pyrkineet seuraamaan sairauden mahdollista kehittymistä mittaamalla esimerkiksi geenien ilmentymistä näiden lasten verisoluissa eri aikoina. Haluamme ymmärtää sairauden syitä ja löytää biomarkkereita, joiden avulla potilaat voitaisiin ohjata mahdollisimman aikaisin hoitoon. Olemme katsoneet myös veriplasman proteiineja, suolistomikrobien kehittymistä sekä epigenetiikkaa – eli olemme pyrkineet kartoittamaan, mitä siellä tapahtuu molekyylitasolla.

Todennäköisesti ei ole vain yhtä tai yhtä kahta diabeteksen puhkeamista ennustavaa molekyyliä, vaan kyse on isommista muutoksista ihmisen immuunijärjestelmässä.

– Monenlaista kiinnostavaa on jo löytynyt, vaikka varsinainen Graalin malja on ainakin toistaiseksi vielä hukassa.

Kuuntele tästä Harri Lähdesmäen virkaanastujaisesitelmä.

Signaaleja kohinan seasta

Lapsille tehtyjen aikasarjamittausten analysointi sujuu luontevasti tilastollisin työkaluin. Samalla tutkijat kehittävät uusia tilastollisia ja koneoppimisen menetelmiä, joilla haetaan kiinnostavia signaaleja datan kohinan seasta.

– Mittauskohinaa on vähemmän kuin biologista vaihtelua, sillä ihmispopulaatio on niin heterogeeninen. Ihmisten elintavat ja elinympäristö suoliston mikrobeja myöten ovat nekin hyvin erilaisia. Tutkittava kokonaisuus on valtava ja siellä on lähes rajattomasti löydettävää. Taustalla on myös tavoite ymmärtää molekyylitason mekanismeja eli niitä sääntöjä tai sitä koneistoa, joka kertoo, kuinka ihminen solut toimivat.

Solujen toiminnan mallintaminen on toinen tutkimushaara, jossa tarvitaan edistynyttä laskentaa. 

– Yhtälöistä rakennetuille matemaattisille malleille syötetään ärsykkeitä ja katsotaan miten ne reagoivat. Mallit täytyy ensin täydentää – tai oppia tilastollisilla menetelmillä – syöttämällä niille oikeaa dataa. Haluamme ennen kaikkea selvittää, miten biologia toimii. Ja siinä data- ja laskennalliset tieteet ovat kehittyneet viime aikoina paljon, rinta rinnan mittausteknologioiden kanssa.

Data puhuu puolestaan

Sekvensointilaitteet ja teknologiat tuottavat jatkuvasti suurempia määriä raakadataa analysoitavaksi. Valtavien datamassojen tallennus ja käsittely ei ole tähän asti ollut ongelma. Käytännön työssä on lisäksi mahdollista rajoittaa datan määrää murto-osaansa tallentamalla vain olennainen tieto.

Perustaltaan lääketiede ei ole muuttunut, vaikka resoluutio, jolla asioita mitataan, ja datan määrä ovat kasvaneet niistä ajoista, jolloin lääkärillä oli käytössään vain kuumemittari. 

– Datamäärien kasvu on toki muuttanut triviaalin päättelyn ja analyysin hyvin monimutkaiseksi laskennaksi, jossa laskennalliset ongelmat ja oikean lähestymistavan valinta vaativat bioinformatiikan syvällistä tuntemusta, Lähdesmäki sanoo.

– Nämä ovat tilastollisia ongelmia ja niihin käytetään tilastollisia menetelmiä – esimerkiksi joustavaa tilastollista koneoppimista – jos ei tiedetä tarkalleen niitä mekanismeja ja malleja, jotka tätä dataa tuottavat. Annamme datan puhua puolestaan.

Perustutkimus jatkuu

Lähdesmäki uskoo, että iso osa bioinformaatikoista pysyttelee vielä pitkään korkeakouluissa ja tutkimuslaitoksissa, sillä heidän työnsä on vielä monella tavalla perustutkimusta ja kehitettyjen uusien sovellusten käyttöönotto terveydenhuollossa vaatii pitkän hyväksymisprosessin. 

– Terveysteknologia on meille bioinformaatikoille merkittävä kasvuala ja tulevaisuudessa isoin työllistäjä, sillä tuotteisiin liittyy yhä enemmän data-analyysiä sekä koneoppimisen ja tekoälyn ongelmia. Vaikka useimmat uudet sovellukset eivät vielä kytkeydy syvälle molekyylibiologiaan, erilaisten sensorien käyttö ja niistä saatavan datan määrä lisääntyy jatkuvasti sekä klinikoilla että kotisovelluksissa. Ja kysymyksenasettelu on niissä samankaltainen, eli mitä me voimme päätellä yksilön terveydestä tällä määrällä sensoreita? •

Lue seuraavaksi Bioinformatiikka ja geenitutkimus 2/4 tästä.

teksti: Jussi-Pekka Aukia
kuvat: Suomen molekyylilääketieteen instituutti FIMM ja jussi-pekka aukia

 

 

 

Anna palautetta

Viesti välitetään sähköpostilla sivuston ylläpitäjille. Sitä ei julkaista.

Anna palautetta

Viesti välitetään sähköpostilla sivuston ylläpitäjille. Sitä ei julkaista.