Tekoälystä tohtori? Uudet välineet muuttavat ihmisen roolia tutkimuksessa

Tekoälylle voitaisiin syöttää periaatteessa kaikki luonnontieteen alalla julkaistavat artikkelit ja väitöskirjat. Julkaistun materiaalin käyttöä on vaikea täysin kieltää ja mahdollisen kiellon valvominen on käytännössä mahdotonta. Uusi työkalu voi tehostaa siiloutuneen tiedon hyödyntämistä, mutta pakottaa samalla tutkijat pohtimaan omaa rooliaan tieteen tekemisessä.

Luonnontieteilijät toivottaisivat epäilemättä tervetulleeksi työkalun, joka pysyisi jatkuvasti ajantasaisena kaikesta luonnontieteiden piirissä syntyvästä tutkimuksesta. Tehtävä olisi periaatteessa mahdollinen tekoälylle, koneelle voitaisiin syöttää vaikka kaikki fysiikan, kemian ja biologian alalta syntyvät tieteelliset artikkelit ja väitöskirjat. 

LUT kauppakorkeakoulun teollisuusprofessori Mika Ruokonen ei usko, että monikaan tutkija haluaisi rajoittaa väitöskirjansa käyttöä. Heikkolaatuisista julkaisuista voi kuitenkin tulla ongelma tekoälyille.  

Jos tekoälyn rakentamisessa on käytetty heikkolaatuista tutkimusmateriaalia, tuloksiin voi vaikuttaa syötteen mukana järjestelmään pesiytynyt harhainen data. Tuloksia vinouttavaa ainesta voi olla erittäin vaikeaa penkoa esiin. Jos tekoälyjä käytetään jatkossa vielä toinen toistensa kouluttamiseen, harha leviää muihinkin malleihin. 

Ruokosen mukaan mallit voivat kuitenkin myös puhdistua vuorovaikutuksen myötä. 

– Eri tekoälyjen antamien tulosten vertailu voi myös auttaa havaitsemaan epäilyttäviä poikkeamia.

Viimeinen vastuu tutkijalla

Ruokonen näkee tekoälyn yhtenä keskeisenä hyötynä kyvyn löytää säännöllisyyksiä ja poikkeamia aineistosta, joka on liian laaja ihmisen hahmotettavaksi.

Koneen kyvykkyydet voivatkin tuottaa uusia oivalluksia ilmiöiden yhteyksistä ja ehkä myös niiden taustalla olevista tekijöistä. Tämä nostaa esiin kysymyksen, voiko kone tuottaa kokonaan uutta tietoa. Eli voiko tekoälystä tulla tohtori?

Ruokonen ei menisi näin pitkälle. Hänen mielestään tohtori on jatkossakin oman tutkimustyönsä tehnyt ja konetta käyttänyt ihminen. 

– Tutkijalle jää kuitenkin aina se viimeinen vastuu syntyneen tiedon laadusta, myös eettisessä ja juridisessa mielessä.

Huoneeseen jää silti lymyilemään iso elefantti. 

Jos kone on kerännyt ja analysoinut dataa, havainnut aiemmin tuntemattomia tapahtumia ja yhteyksiä, ehkä jopa keksinyt niiden taustalla vaikuttaneet tekijät, ihmisen rooli on tosiasiassa kutistunut koneen käskyttämiseen.

Tutkijan rooli muuttuu

Aalto yliopiston koneoppimisen professori Arno Solin toteaa yhteyksien etsimisen isoista aineistoista olleen datan louhinnan ydinosaamista alusta pitäen. Tätä on hyödynnetty tutkimuksessa jo pitkään erilaisilla tilastollisen analyysin työkaluilla. Tekoäly on nyt päivittämässä näitä merkittävällä tavalla.  

– Tieteen tekijän rooli ja tapa, jolla tutkimusta tehdään, muuttuu.

Solin huomauttaa, että tutkijat ovat aina sopeutuneet muutoksiin ja ottaneet nopeasti käyttöönsä uudet resurssit. 

– Ajatus jonkinlaisesta luomutieteestä, joka torjuisi uudet teknologian tarjoamat mahdollisuudet, on absurdi. 

Vaikka geneerisen, synteettisen älyn syntyminen voisi tehostaa tuntuvasti tutkimusta ja aineistojen hyödyntämistä, kehityksen kaikkia vaikutuksia on vaikea arvioida.   

Solin toteaa kaikkien tutkintojen olevan etappeja, joilla tutkija osoittaa pätevyytensä. Inhimillisen ”oppineisuuden” merkitys kuitenkin muuttuu, jos taustalla toimii kaiken tutkimustiedon tietävä ja kaikki mahdolliset päättelyketjut toteuttava tekoäly. 

Solin pohtii tässä yhteydessä shakin tarinaa. Peli oli pitkään ihmisten ylpeyden aihe, ei ole enää. Nyt on selvää, ettei ihminen voi voittaa konetta shakissa.

– Ihmisen päihittäminen onnistuu nykyään jo puhelimelta. Shakkiturnauksia käydään edelleen, mutta ne järjestetään ihmisten kesken. 

Valjussa tulevaisuudenkuvassa tieteenkin tekeminen ihmisten resursseilla olisi jonkinlaista perinneyhdistysten puuhastelua. Kaikille olisi itsestään selvää, että todellinen vääntö jätetään koneen tehtäväksi.  

– En usko tämän toteutuvan näköpiirissä olevassa tulevaisuudessa, mutta liioiteltuun inhimilliseen itsevarmuuteen ei kannata tuudittautua.

Mallien läpinäkyvyyttä pyritty lisäämään

Teknologiaoikeuteen erikoistunut lakimies Herkko Hietanen kertoo EU:ssa julkaistun 2019  DMS-direktiivin, joka harmonisoi tekoälyihin liittyvää sääntelyä myös tekijänoikeuksien osalta. Suomessa tekoälyn koulutusta säädellään tekijänoikeuslain 13b§:ssä otsikolla Tiedonlouhinta.

Julkaistuja väitöskirjoja voidaan käyttää tekoälyn koulutukseen kysymättä erikseen tutkijan lupaa tähän. Jos tutkija on kuitenkin kieltänyt aineiston käytön, kieltoa on kunnioitettava. 

– Väitökseen voi liittää sähköisesti ilmoituksen siitä, ettei tätä saa käyttää tekoälyn koulutukseen.

Täkäläiset tekijänoikeuslait ovat kuitenkin kansallisia, eivätkä päde esimerkiksi USA:ssa tai Kiinassa. Varauksilla on silti merkitystä, jos EU:n ulkopuolella rakennettua tekoälyä käytetään Euroopassa, mallin on noudatettava eurooppalaisia sääntöjä.  

EU:n sääntelyssä onkin pyritty lisäämään mallien läpinäkyvyyttä, missä on Hietasen mukaan osin myös onnistuttu.

– Uusissa malleissa on avattu aiempaa enemmän koneen päättelypolkua sekä vastauksen taustana olevia lähteitä.

Hietasen mukaan tutkija ei kuitenkaan voi kieltää tutkimuslaitoksia käyttämästä väitöskirjoja tekoälyn koulutukseen. Jos esimerkiksi Helsingin yliopisto haluaisi tehdä väitöskirja-aineistosta kielimallin, tutkija ei voisi kieltää väitöskirjansa käyttämistä sen koulutukseen. 

Tämä avaa oven myös yrityksille, joilla ei ole samoja valtuuksia.

– Esimerkiksi Meta on palkannut tutkimuslaitoksia tekemään louhintaa aineistoilla, joita se ei voisi itse käsitellä.

Ajatus teknologian tarjoamat mahdollisuudet torjuvasta luomutieteestä on absurdi.

Hietasen mielestä väitöskirjojen tekijänoikeuksia isompi ongelma tekoälyjen kehittelyssä on mallien epäluotettavuus. Niihin päätyneiden virheiden poistaminen on vaikeaa, tuloksissa on edelleen paljon ”hallusinaatioita”, ja eri mallit voivat antaa samasta asiasta päinvastaisia tuloksia. 

Epävarmuuksista huolimatta Hietanen kertoo ihmettelevänsä, kuinka nopeasti ja kuinka pitkälle tekoälyn kehittelyssä on jo nyt päästy.

Malleista on jo tuntuvaa hyötyä tutkimusprosessin jokaisessa vaiheessa, eikä Hietanen usko kehityksen olevan pysäytettävissä.

– Internetin syntyessä käytiin keskustelua siitä, voidaanko tieteellisessä työssä hyödyntää netistä saatavaa tietoa. Nyt kukaan ei enää ajattele, että tietoa olisi lähdettävä kaivamaan kirjastoista. 

Lataa artikkeli

  • Tämä artikkeli (pdf)