Blogikirjoitus: Sattuma suosii (teoreettisesti) valmistautunutta mieltä Data on suurta, koneet oppivat, joten mitä hyötyä teoriasta ylipäätään on? Eikö suurin osa löytöistä johdu sattumasta, kun taas teoria toimii lähinnä "kuolemanjälkeisenä"? Väitän, että tämä näkemys vähättelee teorian arvoa. TL; dr On yleinen toteamus, että teoria seuraa käytäntöä, melkein kuin "jälki-kuolema", mikä saa monet kyseenalaistamaan teorian arvon, erityisesti nykyaikaisessa, datapainotteisessa maailmassamme. Miksi panostaa teoriaan? Uskon, että tämä ajattelutapa juontaa juurensa liian kapeasta näkemyksestä kausaalisesta löytöketjusta. Jos zoomaat ulos, näet lukuisia tapoja, joilla teoria on moottori, joka ohjaa keksijöitä uusiin löytöihin. Väitän, että meidän on säilytettävä paikka teorialle nykyaikaisessa maailmassamme, jottei unohdeta joitakin oppeja siitä, miten tiede ja yhteiskunta kehittyvät. Teoria on nykyään huonossa jamassa. 1900-luvun voittojen jälkeen, kun olemme siirtyneet tutkimaan monimutkaisia järjestelmiä, jotka ehkä nyt alkavat paljastaa salaisuuksiaan koneoppimiselle, on muodikasta kysyä, miksi vaivaudumme ylipäätään teoriaan – kerätään kaikki data ja annetaan GPU:iden kertoa, mitä kaikki se tarkoittaa. Tämä ajattelutapa ei kuitenkaan ole uusi tekoälyn aikakaudella. Väitteet siitä, että teorialla on rajallinen arvo, koska se usein syntyy vasta sen jälkeen, kun insinöörit ovat tehneet kaikki käytännön edistysaskeleet, ovat olleet olemassa niin kauan kuin muistan. Periaatteessa teoria on kuin "jälki-ruumis", jolla selitetään, miten asiat toimivat parille tietämättömälle vielä pitkään sen hyödyllisyyden jälkeen. Esimerkiksi: Uskon, että nämä argumentit kumpuavat liian kapeasta näkemyksestä edistyksestä. Ongelma on, että teorian sovellusten aikaskaalat ovat itse asiassa niin pitkiä, että syy-seuraussuhde sekoitetaan. Otetaan yllä mainittu esimerkki piireistä ja Maxwellin yhtälöistä, jotka ohjaavat sähködynamiikkaa. Kyllä, piirit ovat ehdottomasti Maxwellin yhtälöitä vanhempia, joten jos asiaa katsoo niin, se on kyllä "jälkipuinti". Katsotaanpa kuitenkin hieman kauemmas. Laittoivatko ihmiset satunnaisesti metallipaloja yhteen ja huomasivat, että ne muodostivat piirejä? Ei todellakaan! Tuolloin ajatus (teoria, jos niin haluat), että sähkö oli neste (Ben Franklin), joka voi liikkua paikasta toiseen, toimi piirisuunnittelun perustana. En ole varma, mutta olettaisin, että tuo teoria toimi piirien perustana. Voimme tehdä saman harjoituksen toisella puolella. Otetaan esimerkiksi Marconin radion keksintö. Oliko hänen keksintönsä vain satunnaisen näpertelyn tulos? Ei todellakaan. Hänen työnsä perustui jo vahvasti sähkömagneettisen säteilyn aaltoteoriaan (jonka Hertz on vahvistanut), ilman sitä hänellä ei yksinkertaisesti olisi ollut mitään mahdollisuutta edistyä. Voin olettaa, että nämä teoriat olivat hyvin vakiintuneita, luultavasti niin paljon, että niitä pidettiin itsestäänselvyyksinä. Toki voisi väittää, että biotieteissä luotamme paljon enemmän kokeiluihin ja sattumoihin, joten teorian merkitys on pienempi. Mielestäni on tunne, että meidän pitäisi siksi tehdä paljon enemmän kokeiluja. Katso esimerkiksi @RuxandraTeslo:n twiitti, joka on tehty viitaten yllä olevaan twiittiin teorian laggaa-käytännöstä. Olen tähän asti täysin myötätuntoinen, ja olen samaa mieltä Teslon kanssa siitä, että tarvitsemme paljon enemmän kokeiluja. Ja varmasti sattuma nousee usein esiin lääkekehityksen yhteydessä. Mutta tässä on se juttu: kaikkien mahdollisten kokeiden tila on mahdottoman suuri, ja teoria toimii (joskus näkymättömänä) oppaana tässä tilassa. Katsotaanpa penisilliiniä, joka on näennäisesti klassinen sattuman tapaus: Fleming jättää Petri-kuoren ulos, joka homehtuu ja home tappaa bakteerit. Tästä johdetaan penisilliini, ja uusi lääketieteen aikakausi syntyy, näennäisesti sattumalta, riippumatta niistä yksityiskohdista ("vaikutusmekanismi"), joiden kautta penisilliinin vaikutukset välittyvät. Mutta tässäkin kaava on itse asiassa sama. Zoomaa hieman kauemmas, ja tämän löydön perusta on tautiteoria, jonka Pasteur oli kehittänyt noin 60 vuotta aiemmin. Ilman bakteeriteoriaa tälle havainnolle ei olisi mitään perustetta. Tarkastellaan myös toiseen suuntaan: penisilliiniresistenssin geneettisen perustan löytäminen on ratkaisevan tärkeää molekyylisen kloonauksen kannalta, joka ruokki bioteknologian alaa. Sama koskee syöpäkemoterapioita. Sisplatiini löydettiin havaitsemalla, että elektrodi estää bakteerien jakautumisen, joten perusteluna oli, että sillä voisi olla vaikutusta solunjakautumiseen syövässä. Kuitenkin koko tämä ketju perustuu itse tietoon, että syöpä on sairaus, jossa omat solumme jakautuvat hallitsemattomasti. Itse asiassa suurimman osan ihmiskunnan historiasta ajateltiin, että syöpä oli itse asiassa tauti, jonka aiheuttivat vierasesineet tai kehon nesteiden sisäiset epätasapainot. Käsitteellinen innovaatio vaadittiin, jotta joku pystyi tekemään ne yhteydet, jotka tarvitsivat havainnon merkityksen ymmärtämiseksi. Joka tapauksessa, jälleen kerran, mikään tästä ei tarkoita, etteikö sattuma vaikuttaisi mitenkään, eikä että kliinisiä tutkimuksia pitäisi tehdä vähemmän kuin enemmän (väittäisin ehdottomasti päinvastoin). Mutta uskon, että kaiken suuren läpimenon tiedonkeruun, koneoppimisen ja vastaavien ympärillä vallitsevan innostuksen keskellä meidän tulisi olla varovaisia, ettemme aliarvioi teorian arvoa. Emme ehkä näe sitä heti tai edes lyhyellä aikavälillä, mutta jätämme teorian huomiotta omalla vastuullamme. Se valmistaa mieltämme muuttamaan muutoksen sattumaksi. PS: On myös huomionarvoista, että kaikki nämä löydöt tehtiin ihmisten toimesta, jotka olivat syvästi syventyneitä aloihinsa. Nämä eivät olleet satunnaisia ihmisiä, jotka tekivät satunnaisia asioita. Nämä olivat hyvin valmistautuneita ihmisiä. Vallitsee vallan vastainen tunne, jonka mukaan oppilaitokset estävät tietoa ja edistystä. Mielestäni todisteet eivät yksinkertaisesti tue tätä näkemystä.