Tekoälymallit eskaloivat kriisien simulaatiot ydinsodiksi

Jokaisen testattu tekoälymalli noudatti erilaista strategista lähestymistapaa.
Perinteisellä sääennustusmallilla tehty ennuste ja oikealla tekoälymallilla (ECMWF:n AIFS) tehty ennuste Ilmatieteen laitoksella. LEHTIKUVA / MIKKO STIG
Perinteisellä sääennustusmallilla tehty ennuste ja oikealla tekoälymallilla (ECMWF:n AIFS) tehty ennuste Ilmatieteen laitoksella. LEHTIKUVA / MIKKO STIG

Tutkimuksen mukaan tekoälyjärjestelmät eskaloivat simuloidut geopoliittiset kriisit ydinsodiksi noin 95 prosentissa niille syötetyissä skenaarioissa. Lontoossa sijaitsevan King’s Collegen professori Kenneth Payne asetti kolme kärkipään tekoälymallia, Open AI:n ChatGPT 5.2:n, Anthropicin Claude Sonnet 4:n ja Googlen Gemini 3 Flashin, vuorotellen valtionjohtajan rooliin kahden ydinasevallan välisessä kriisissä.

Yhteensä 21 kriisipeliä sisälsi 329 päätösvuoroa, joihin tekojärjestelmät prosessoivat niille annettuja tiedustelupäivityksiä ja tuottivat lähes 780 000 sanan verran strategista järkeilyä punnitessaan diplomaattisia ja sotilaallisia vastauksia.

Mainos - sisältö jatkuu alla
Mainos - sisältö jatkuu alla

Payne havaitsi jokaisen tekoälymallin noudattavan erilaista strategista lähestymistapaa. ChatGPT osoitti pääasiassa pidättyvyyttä, mutta määräaikapaineen kasvaessa siirtyi yllättäen nopeaan ja ratkaisevaan ydinase-eskalaatioon. Claude Sonnet rakensi aluksi luottamusta yhtenäistämällä signaalinsa ja toimenpiteensä, mutta konfliktin kiihtyessä eskaloi pidemmälle kuin aikoi. Gemini pyrki laskelmoituun epäennustettavuuteen
klassisen uhkapelistrategian mukaisesti.

Vaikka tekoälymallit osoittivat kykyä monimutkaiseen analyysiin ja selkeään tietoisuuteen eskalaatioriskeistä, ne toistuvasti kiihdyttivät konflikteja pyrkimättä perääntymään. Yksikään ei valinnut vaihtoehdoksi antautumista tai strategista myönnytystä.

Payne kirjoittaa, että vaikka ”kukaan ei anna ydinaseiden koodeja ChatGPT:lle”, ymmärrys siitä, miten tekoälymallit järkeilevät, on tulossa yhä tärkeämmäksi, kun ne ”alkavat tarjota tukea strategistien päätöksille”. Kiistat varotoimista ja tekoälyn valvonnasta alkoivat, kun Yhdysvaltain puolustusministeriö laajensi kaupallisten tekoälymallien käyttöä klassisten tiedustelu- ja operatiivisen suunnitteluverkkojen tukena.

Suomen heikot lenkit ovat palvelualoilla ja julkisessa sektorissa, taloustieteilijä Markku Stenborg sanoo näkökulmassaan.
Toimitusjohtaja Jack Dorseyn mukaan työnteko ja yrityksen johtaminen on mullistunut.
Mainos