Raportissa vihapuheella tarkoitetaan viestintää, jonka merkitys tai sävy on halventava, nöyryyttävä, uhkaava, vihamielinen, hyökkäävä tai epäinhimillistävä. LEHTIKUVA/ANTTI AIMO-KOIVISTO

Tekoäly pöyhi suomalaista vihapuhetta

Raportin mukaan 97 prosenttia vihapuheesta esiintyy verkon keskustelupalstoilla.

Oikeusministeriön julkaisema Tekoälyn hyödyntäminen vihapuheen seurannassa -raportti tarjoaa kuvaa verkon julkisessa keskustelussa esiintyvästä suomenkielisestä vihapuheesta.

Raportin teki Utopia Analytics, joka yhdisti työssä ihmistyötä ja koneoppimista. Oikeusministeriö tilasi raportin osana EU-rahoitteista Tiedolla vihaa vastaan -hanketta.

Aineistossa ei ole mukana ei-julkinen keskustelu, kuten Facebookin suljetut ryhmät ja yksityiset tilit.

Raportissa vihapuheella tarkoitetaan viestintää, jonka merkitys tai sävy on halventava, nöyryyttävä, uhkaava, vihamielinen, hyökkäävä tai epäinhimillistävä. Kohteena voivat olla henkilökohtaiset ominaisuudet kuten henkilön ikä, uskonto tai vakaumus tai tietty ihmisryhmä.

Oikeusministeriön mukaan raportin tarkoituksena ei ole ottaa kantaa siihen, onko jokin yksittäinen ilmaisu laissa kielletty.

Raportin mukaan 97 prosenttia vihapuheesta esiintyy verkon keskustelupalstoilla, näistä valtaosa Ylilauta-sivustolla. Twitterissä esiintyi 2,5 prosenttia vihapuheeksi tunnistetuista viesteistä.

Julkisilla suomenkielisillä alustoilla on raportin mukaan noin 150 000 vihapuheeksi luokiteltavaa viestiä kuukaudessa. Tämä on 1,8 prosenttia kaikista viesteistä.

Ihmisryhmiä leimaava ja yleistävä vihapuhe yleisintä

Suurimmilta keskustelupalstoilta ja uutissivustoilta, blogeista sekä julkisista keskusteluista Twitterissä, Facebookissa ja Instagramissa kerätty aineisto analysoitiin tarkemmin tekoälyn avulla.

Tästä aineistosta 62 prosenttia luokiteltiin ihmisryhmää leimaavaksi tai yleistäväksi, 32 prosenttia solvaukseksi tai muuksi vihapuheeksi, neljä prosenttia henkilökohtaisiin ominaisuuksiin liittyväksi vihapuheeksi ja kaksi prosenttia ammattiryhmään kohdistuvaksi vihapuheeksi.

Aineisto koostuu julkisen internetin noin 12 miljoonasta suomenkielistä kommentista ja nettikirjoituksesta syys–lokakuussa 2020. Aineisto käsittää muun muassa suurimmat keskustelupalstat ja uutissivustot, blogeja sekä julkisia keskusteluja Twitterissä, Facebookissa ja Instagramissa.

Raporttia varten kerättiin aineistoa myös käsin Ylilauta- ja Hommaforum-sivustoilta, joille hakurobottien vierailut on estetty.

Utopia Analyticsin raportti julkaistaan oikeusministeriön julkaisusarjassa. Ministeriö toteaa, että raportin sisällöt ovat täysin tekijöiden vastuulla, eivätkä ne välttämättä edusta Tiedolla vihaa vastaan -hanketta rahoittavan Euroopan komission tai oikeusministeriön näkemyksiä.

Kommentit

Miksi kommentit eivät näy? »Kommentoinnin säännöt