Jalankulkijoita Manhattanilla. / AFP / LEHTIKUVA / SPENCER PLATT

Tekoäly ennustaa työttömyysasteen paremmin kuin asiantuntijat

Järjestelmä olisi erityisen hyödyllinen kehittyville maille, joissa tilastopalveluilla ei ole resursseja kerätä ajantasaista työmarkkinadataa.
MAINOS (artikkeli jatkuu alla)

Joukko tutkijoita New York, Oxford ja Ben-Gurion Universitystä sekä Maailmanpankista ovat kehittäneet tekoälyjärjestelmän, joka pystyy sosiaalisen median julkaisujen perusteella ennustamaan Yhdysvaltojen työttömyysasteen kaksi viikkoa ennen kuin viralliset tilastotiedot julkaistaan.

Tutkijat julkaisivat tuloksensa Oxfordin PNAS Nexus -tiedejulkaisussa.

He loivat JoblessBERT-mallin, joka koulutettiin tunnistamaan Twitterin (nykyisen X:n) julkaisut, joissa käyttäjät kertoivat työnsä menettämisestä. Toisin kuin perinteisissä menetelmissä, jotka nojautuvat täsmällisiin ilmauksiin, kuten ”I just lost my job”, neuroverkko tunnistaa puhekielen ilmaukset, slangin ja kirjoitusvirheet, kuten ”neeeed a job” tai ”needa job”.

Tämän ansiosta verkko tunnistaa 13 kertaa enemmän työttömiä käyttäjiä ja säilyttää korkean tarkkuuden.

Twitterin käyttäjät eivät heijasta maan väestöä kokonaisuutena, koska nuorten ja suurten kaupunkien asukkaiden osuus korostuu. Sen kompensoimiseksi tutkijat määrittivät käyttäjien iän, sukupuolen ja sijainnin heidän profiilikuvistaan ja sopeuttivat datan väestönlaskentatietoihin.

Mallia testattiin käyttäen vuosien 2020–22 dataa, johon sisältyy koronapandemia. Kun viikoittaiset työttömyysluvut nousivat 252 000:sta 2,9 miljoonaan maaliskuussa 2020, ammattianalyytikot ennustivat työttömyyden nousua vain 327 000:een, mutta kaksi päivää ennen virallista raporttia JoblessBERT ennusti 2,66 miljoonaa työtöntä.

Keskimäärin kahden viikon ennustushoristontissa JoblessBERT oli 54 prosenttia tarkempi kuin perinteiset menetelmät kansallisella tasolla ja 36 prosenttia tarkempi osavaltiotasolla.

Järjestelmä toimii myös yksittäisten kaupunkien kohdalla ja pystyy täyttämään virallisten tilastojen aukot, jos dataa julkaistaan epäsäännöllisesti.

Tutkijat huomauttavat menetelmänsä rajoituksista: tutkimus toteutettiin ainoastaan englanninkielisistä some-julkaisuista, ja pääsyä X:n dataan on rajoitettu merkittävästi vuoden 2023 jälkeen.

Heidän mukaansa lähestymistapaa voidaan kuitenkin soveltaa muillekin alustoille ja kieliin, mikä olisi erityisen hyödyllistä kehittyville maille, joissa tilastopalveluilla ei ole resursseja kerätä ajantasaista työmarkkinadataa.

MAINOS (sisältö jatkuu alla)
Uusimmat
MAINOS (sisältö jatkuu alla)
MAINOS

Opi sukeltamaan, ajattele kuin valkohai!

Suositut sukelluskurssit kokeneiden ammattilaisten johdolla. Verkkokaupassamme voit räätälöidä itsellesi sopivan paketin.
Tarjous

MUISTA LOGO!

Oy Sarin sukellus Ab
Roihupellon maauimala, Niinistö

Hyvä Verkkouutisten lukija,

Kehitämme palveluamme ja testaamme uusia sisältöformaatteja erityisesti mobiililaitteille. Haluaisitko osallistua testiin tässä ja nyt? Se vie vain muutaman minuutin.

(Uusi sisältö aukeaa painiketta klikkaamalla)