Vihapuhetta tunnistavat työkalut helposti huijattavissa

Ilkka Ahtokivi
Julkaistu 14.09.2018 | 20:07
Päivitetty 14.09.2018 | 20:07

Tutkijat osoittivat, että sosiaalisessa mediassa ja verkkopalveluissa käytettävät vihapuheentunnistimet ovat helposti ihmisten huijattavissa.

MAINOS (artikkeli jatkuu alla)

Vihapuheen ja loukkaavan kommentoinnin määrä verkossa vain kasvaa. Sen hillitsemiseksi tarvitaan automaattisia työkaluja, jotka tunnistavat verkkopalvelujen sääntöjen vastaisen tai jopa laittoman sisällön.

Aalto-yliopiston Secure Systems -tutkimusryhmä on kuitenkin löytänyt parhaistakin koneoppimiseen perustuvista vihapuheentunnistimista merkittäviä heikkouksia. Käyttäjien on yllättävän helppo kiertää vihapuheen suitsemiseen kehitettyjä tekoälytyökaluja.

Tarkoituksellinen tai tahaton huono kielioppi ja kirjoitusvirheet voivat tehdä vihanlietsonnasta ja loukkauksista tekoälylle vaikeita tunnistaa.

Ryhmä kokeili seitsemän uuden tunnistamistyökalun tarkkuutta. Kaikki reputtivat testit.

Nykyaikaiset luonnollisen kielen prosessointiin käytetyt mallit pystyvät luokittelemaan tekstiä merkkien, sanojen ja lauseiden piirteiden perusteella. Kun mallit joutuvat analysoimaan tekstidataa, jollaista ei ole käytetty niiden opettamiseen, tulosten laatu alkaa kärsiä.

– Lisäsimme vihapuheeksi tai loukkaavaksi määriteltyjen kommenttien sekaan kirjoitusvirheitä, muokkasimme sanojen rajoja tai lisäsimme joukkoon neutraaleja sanoja. Välilyöntien poistaminen sanojen välistä osoittautui englanninkielisen sisällön manipuloinnissa tehokkaimmaksi. Kaikkia keinoja yhdistelemällä saimme jopa Googlen kommenttien arvottamiseen käyttämän Perspective-työkalun sekaisin, kertoo Tommi Gröndahl, Aalto-yliopiston tohtorikoulutettava.

Google Perspective luokittelee kommenttien loukkaavuutta tai ”toksisuutta” eri tekstianalyysin menetelmien avulla. Viime vuonna Washingtonin yliopiston tutkijat osoittivat, että Perspectiveä voi kuitenkin huijata lisäämällä tekstiin pieniä kirjoitusvirheitä.

Gröndahl havaitsi kollegoineen, että Perspective on sittemmin oppinut tunnistamaan myös kirjoitusvirheet, mutta se on edelleen huijattavissa muunlaisella manipuloinnilla, esimerkiksi poistamalla välilyöntejä ja lisäämällä harmittomia sanoja, kuten love, ’rakkaus’.

Tutkijat huomauttavat, että asiayhteys määrittää pitkälti sen, tulkitaanko yksittäinen kommentti vihaksi vai vain asiattomaksi tai mauttomaksi. Vihapuhe on subjektiivista ja kontekstisidonnaista, ja tutkijoiden mukaan pelkät koneelliset tekstianalyysimenetelmät eivät riitä sen tarkkaan tunnistamiseen.

– Ihmiset muuttavat toimintaansa ja alkavat kokeilla eri tapoja kirjoittaa, koska he haluavat välttää kiinnijäämistä. Ollakseen tehokas tekoäly tarvitsee avukseen ihmisen tekemää tulkintaa, uskoo tutkimusryhmän johtaja, Aalto-yliopiston professori N. Asokan.

Tekstiä analysoivien koneoppimismallien kehittämisessä tulisi tutkijoiden mukaan kiinnittää huomiota mallien opettamiseen käytettävän datan laatuun ja monipuolisuuteen, eikä niinkään mallien rakenteiden hiomiseen.

Tutkimus tehtiin yhteistyössä Aalto-yliopiston Secure Systems -ryhmän ja Padovan yliopiston tutkijoiden kanssa. Tulokset esitellään lokakuussa ACM AISec -konferenssissa Torontossa.

MAINOS (sisältö jatkuu alla)

Uusimmat

Iran

Iran teki kyberhyökkäyksiä jo ennen ohjusiskuja – ”Israel voi tehdä näyttävän vastatoimen”

Jarno Limnellin mukaan Lähi-idän jännittyneessä tilanteessa ovat mukana maailman kyvykkyimmät kybertoimijat.

16.04.2024 | 20:15

Ukraina

Näin lähellä Ukrainan rauha oli neuvotteluissa 2022 – mitä todella tapahtui?

Sekä Venäjä että Ukraina olivat valmiit suurempiin kompromisseihin kuin on tiedetty.

16.04.2024 | 19:50

Politiikka

Asiantuntija hallituksen päätöksistä: Taloustieteilijöitä on selvästi kuunneltu

Aki Kangasharjun mielestä Suomen kaltaisessa maassa menoleikkausten täytyy olla pääosissa, kuten hallituksen päätöksissä on.

16.04.2024 | 18:54

Video

Miten purkaa eläkepommia? Tämä voisi tuoda miljardiluokan säästöt

Työurien pidentäminen on VATT:n ja Tampereen yliopiston tutkija Terhi Ravaskan mukaan mahdollista, mutta helpot keinot on jo käytetty.

16.04.2024 | 18:00

Politiikka

Suurinvestoinneille poikkeuksellinen verokannustin – Ekonomisti: kilpailukykyinen päätös

Hallituksen kasvupaketin mukaan yritykselle voitaisiin myöntää hyvityksenä 20 prosenttia investoinnin kokonaismäärästä, jopa 150 miljoonaa euroa hanketta kohden.

16.04.2024 | 17:44

Kaakosta voi saapua kunnon lumipyry, sää kylmenee rajusti

Tällä viikolla öisiä pakkasia on ajoittain etelässä asti. Lapissa pakkasta saattaa olla jopa 20–25 astetta.

16.04.2024 | 17:19

Iran

Iran teki kyberhyökkäyksiä jo ennen ohjusiskuja – ”Israel voi tehdä näyttävän vastatoimen”

Jarno Limnellin mukaan Lähi-idän jännittyneessä tilanteessa ovat mukana maailman kyvykkyimmät kybertoimijat.

16.04.2024 | 20:15

Ukraina

Näin lähellä Ukrainan rauha oli neuvotteluissa 2022 – mitä todella tapahtui?

Sekä Venäjä että Ukraina olivat valmiit suurempiin kompromisseihin kuin on tiedetty.

16.04.2024 | 19:50

Politiikka

Asiantuntija hallituksen päätöksistä: Taloustieteilijöitä on selvästi kuunneltu

Aki Kangasharjun mielestä Suomen kaltaisessa maassa menoleikkausten täytyy olla pääosissa, kuten hallituksen päätöksissä on.

16.04.2024 | 18:54

MAINOS (sisältö jatkuu alla)

MAINOS