Miltei jokaisessa tekoälystä kertovassa jutussa korostetaan, että tekoäly on maksuton, ilmainen tai vapaasti ladattavissa. Tämä ei kuitenkaan ole koko totuus. Vapaa ladattavuus voi tulla kalliiksi, toisinaan todella kalliiksi.

Ihmiskunta ei ole vielä oppinut, että ilmaista juustoa on vain hiirenpyydyksissä.

Pieni parannus olisi jo se, että tosiasiassa maksullista lakattaisiin kutsumasta maksuttomaksi.

Useimmat meistä eivät ymmärrä, mihin he tarkkaan ottaen sitoutuvat ohjelmistoja ladatessaan sekä käyttäessään. Käyttöehtoja hyväksyessään useimmat meistä eivät paneudu niihin, vaan tulevat hyväksyneeksi ne tajuamatta, mihin kaikkeen he antavat ohjelmistolle oikeudet. Tälle on oma lyhenteensä: TL;DR: too long, didn´t read. Useimmat käyttäjät pitävät käyttöehtotekstejä liian pitkinä ja vaivalloisina, joten he eivät edes lue niitä.

On aivan ilmeistä, että tässä tullaan sekoittaneeksi asioita.

Perinteisesti tietokoneohjelmistoista puhuttaessa tehdään ero kahden vapaa-käsitteen – gratis ja libre – välillä.

Taustalla on englannin kielen free-sanan kaksimerkityksisyys. Nämä merkitykset poikkeavat toisistaan olennaisesti. Vapaa voi merkitä, että tuotteeseen tai palveluun ei liity mitään maksua, että se ei maksa rahaa (gratis). Vapaa voi, toisaalta, myös merkitä, että tuotteeseen ei liity rajoitteita (libre).

Tuote voi olla vapaa gratis-mielessä, vaikka se ei ole sitä libre-mielessä.

Esimerkiksi tietokoneohjelman voi maksutta ladata verkosta, mutta sitä voi käyttää vain tuotteen ylläpitäjän arkkitehtuurissa.

Maksimaalisesti vapaa libre-mielessä tarkoittaa sitä, että ohjelmisto täyttää samanaikaisesti ainakin neljä vapautta:

Vapaus 0: Vapaus käyttää ohjelmaa mihin tahansa tarkoitukseen.

Vapaus 1: Vapaus tutkia ohjelman toimintaa ja muuttaa sitä.

Vapaus 2: Vapaus levittää ja kopioida ohjelmaa.

Vapaus 3: Vapaus parantaa ohjelmaa ja julkaista parannukset.

Moniko käyttäjä osaa erottaa edes avoimen lähdekoodin (open source) ja vapaan ohjelmiston (free software eli freeware)? Harva. Molemmat ovat vapaasti käytettävissä, mutta vain jälkimmäisellä on copyright.

AI-mallit eivät suinkaan ole täysin vapaita sanan missään mielenkiintoisessa mielessä.

Vaikka ohjelman voisikin vielä ladata omalle tietokoneelle maksutta, niin sen käyttö voi silti olla monella tavalla maksullista.

Kuluttajan on syytä tajuta maksavansa näistä näennäisesti ilmaisista tuotteista, tavalla tai toisella.

Maksu voidaan kerätä rahana tai datana – tai molempina. Yleensä molempina.

Rahalla maksaminen on suoraviivaista eikä olennaisilta osin poikkea esimerkiksi sanomalehden tilausmaksun maksamisesta.

Datalla maksamiseen on monenlaisia keinoja ja väyliä. Palveluntarjoaja voi esimerkiksi vaatia käyttäjää rekisteröitymään ja antamaan monenlaisia tietojaan – ja sen jälkeen vielä, erikseen, veloittaa mallin käytöstä rahalla.

Esimerkiksi juuri julkistettu kiinalainen DeepSeek-tekoäly vaatii käyttäjätilin, kuten kaikki muutkin käytössä olevat AI-mallit.

DeepSeekin oman tietosuojakäytännön mukaan se kerää suuria määriä käyttäjiltä kerättyjä henkilökohtaisia tietoja, jotka tallennetaan ”turvallisille palvelimille” Kiinassa.

Tilin saamiseksi pitää käyttäjän antaa ylläpitäjälle esimerkiksi sähköpostiosoitteensa, puhelinnumeronsa ja syntymäaikansa. Ohjelmisto kerää ja tallentaa myös kaikki käyttäjän syötteet, mukaan lukien teksti- ja ääni-, sekä chat-historian. DeepSeek kerää myös niin sanotut ”tekniset tiedot”, jotka vaihtelevat käyttäjän puhelimen mallin mukaan. Esimerkiksi käyttäjän puhelimen käyttöjärjestelmä tallennetaan sekä laitteen IP-osoite. Jopa ”näppäinpainalluskuviot” tallennetaan.

Moniko käyttäjä tajuaa, että yritys kerää kaikki sen mallille asetetut kysymykset sekä niihin mallin antamat vastaukset – ja kytkee nämä tiedot asiakkaan tietoihin?

Yrityksen mukaan näitä tietoja kerätään ja käytetään DeepSeekin ”turvallisuuden (safety), turvallisuuden (security) ja vakauden” parantamiseksi. Näin varmaan onkin. Mihin muuhun näitä tietoja käytetään? Tästä ei ole selvyyttä.

Yhtiö jakaa näitä tietoja muille, kuten yrityksille, mainoskumppaneille ja yritysryhmälleen. Näin kerätty data säilytetään ”niin kauan kuin on tarpeen”. Tätä tarvetta ei arvioi kuluttaja eikä hän voi vaikuttaa säilytyksen kestoon.

Yhdistyneen kuningaskunnan tiedonsäätelyviranomainen, Information Commissioner’s Office (ICO), kehottaa yleisöä tiedostamaan oikeutensa tekoälymallien käytössä.

ICO vaatii: ”Generatiivisen tekoälyn kehittäjien ja käyttöönottajien on varmistettava, että ihmisillä on mielekäs, selkeä ja helposti saatavilla olevaa tietoa henkilötietojensa käytöstä ja että heillä on selkeät ja tehokkaat prosessit, jotta ihmiset voivat käyttää tieto-oikeuksiaan.”

Nythän niin ei selvästi ole.

Meillä tietosuojaviranomaiset nukkuvat Ruususen unta.