Verkkouutiset

THL puolustautuu: Laatu ei saa jäädä avoimuuden jalkoihin

Tietoylijohtaja Pekka Rissasen mukaan keskeneräistä ei julkaista.
MAINOS (artikkeli jatkuu alla)

Terveyden ja hyvinvoinnin laitosta on arvosteltu koronakriisin aikana avoimuuden puutteesta. Kriitikoiden mukaan THL:n mallinnusten tausta-aineistoa ja lähteitä ei ole avattu. Kenties äänekkäimpiä ovat olleet vaatimukset epidemiamallien lähdekoodin julkaisemisesta.

THL:n tietoylijohtaja, professori Pekka Rissanen kirjoittaa blogissaan, että ”avoimuus on THL:n tutkimuksen lähtökohta, mutta laatu ei saa jäädä sen jalkoihin”.

MAINOS (sisältö jatkuu alla)

– Minulle on keskustelusta syntynyt käsitys, että kaikki eivät määrittele käsitettä samalla tavalla. Ehkä on hyvä vähän pohtia, mitä lähdekoodilla tarkoitetaan, hän toteaa.

Keskustelussa näyttää Rissasen mukaan olevan kyse syntaksin avoimuudesta. Sillä tarkoitetaan hänen mukaansa kieltä, jolla tilastojen tutkija ”keskustelee” tilasto-ohjelman kanssa.

– Syntaksia syntyy aina, kun tilasto-ohjelmistoa komennetaan tekemään datan järjestely- tai laskutoimituksia. Tosiasiassa valtaosa syntaksista syntyy siinä vaiheessa, jossa yhdistetään aineistoja ja muotoillaan tai luokitellaan tutkimukseen tarvittavia ja soveltuvia muuttujia, Pekka Rissanen avaa.

Hänen mukaansa tieteen ja tutkimuksen avoimuuden näkökulmasta on vaikea ymmärtää vaatimuksia siitä, että tutkimuksen analyysivaiheessa kehitteillä olevat mallit ja niihin liittyvät syntaksit myös olisivat julkisia.

– Keskeneräisiä töitä kun ei ole tapana julkaista.

Pekka Rissanen epäilee, etteivät tutkijat yleisesti olisi valmiita siihen, että keskeneräisiä syntakseja julkaistaan. Yhtenä syynä hän mainitsee sen, etteivät tieteelliset julkaisusarjat julkaise jo aiemmin muualla julkaistuja tuloksia.

Ratkaista pitäisi Rissasen mukaan myös, julkaistaanko syntaksista kaikki varsinaiseen tilastolliseen analyysiin tarvittavat aineiston rakennusosatkin vai pelkästään varsinaisen mallin syntaksi.

Mitä halutaan?

THL:n malleja koskevassa keskustelussa on usein painotettu myös päätöksenteon avoimuutta. Pekka Rissasen mukaan määrittelemättä on kuitenkin jäänyt, mitä tarkkaan ottaen vaaditaan.

THL:n mallinnusten hän sanoo olevan toistettavissa jo julkaistuilla tiedoilla.

– Kaikki THL:n epidemiologisten COVID-19-ennustemallien muodostamiseen tarvittavat tiedot ovat kenen hyvänsä käytettävissä jo nyt. Mallien keskeiset oletukset, matemaattinen rakenne, lasketut parametrit ja niin edelleen on julkaistu. Niiden perusteella kuka hyvänsä voi toistaa tutkimuksen ja varmentaa osaltaan epidemiaan liittyvien ennusteiden luotettavuutta.

Pekka Rissasen mukaan oma kysymyksensä on sekin, minkä mallien syntaksien julkistamisesta edes olisi hyötyä.

– Jokaisessa mallissa on luonnollisesti omat erilaiset syntaksinsa. Niitä on muutettava kun uusia rajoituksia epidemian vuoksi asetetaan tai puretaan, koska ennusteisiin vaikuttavat asioiden tilat muuttuvat samalla. Esimerkiksi kesäkuun aikana tilanteet ovat muuttuneet useita kertoja – ja ennustemallien syntaksit samalla, hän avaa.

Rissanen muistuttaa tieteen kehittyvän kumulatiivisesti. Hänen mukaansa THL:n COVID-19-mallinnuksen menetelmiä ja tilastollisia lähestymistapoja ja niiden soveltuvuutta muuttuvaan tilanteeseen ja aineistoon arvioidaan jatkuvasti.

– Myös lähdekoodit – tässä siis syntaksit – voivat muuttua nopeastikin. Julkisia niistä tulee sitten, kun niiden laatu on hyväksi havaittu.

MAINOS (sisältö jatkuu alla)
MAINOS (sisältö jatkuu alla)
Viikon suosituimmat videot
Uusimmat
MAINOS (sisältö jatkuu alla)
MAINOS

Hyvä Verkkouutisten lukija,

Kehitämme palveluamme ja testaamme uusia sisältöformaatteja erityisesti mobiililaitteille. Haluaisitko osallistua testiin tässä ja nyt? Se vie vain muutaman minuutin.

(Uusi sisältö aukeaa painiketta klikkaamalla)