Metan johtaja liitti tekoälyagentin sähköpostiinsa – näin kävi

Uhri myönsi, että tapahtui aloittelijan virhe.
Metan pääkonttori Kalifornian Menlo Parkissa. LEHTIKUVA / HEIKKI SAUKKOMAA
Metan pääkonttori Kalifornian Menlo Parkissa. LEHTIKUVA / HEIKKI SAUKKOMAA

Meta Superintelligence laboratorion tekoälyn turvallisuutta ja suuntaamista tutkivan osaston johtajasta Summer Yuesta tuli oman kokeensa uhri: suosittu tekoälyagentti OpenClaw poisti yli 200 sähköpostia hänen postilaatikostaan sivuuttaen kaikki komennot toiminnan lopettamiseksi. Hän kuvasi tapahtunutta julkaisussaan X:ssä.

Yue testasi OpenClaw:ta, joka osaa suorittaa tehtäviä autonomisesti ympäri vuorokauden. Kokeiltuaan sitä ensin testitilillä hän liitti botin omaan pääsähköpostiinsa ohjeistaen sitä olemaan tekemättä mitään ilman hänen hyväksyntäänsä.

Mainos - sisältö jatkuu alla

Kun tekoälyagentti kohtasi suuren määrän sähköposteja, käynnistyi kontekstin tiivistämistoiminta – keskusteluhistorian automaattinen vähentäminen – jossa katosi käsky olla toimimatta itsenäisesti.

Sen seurauksena OpenClaw alkoi poistaa ja arkistoida sähköposteja kiihtyvällä vauhdilla ilmoittaen tarkoituksekseen panna roskiin kaikki ennen 15. helmikuuta tulleet sähköpostit. Yue yritti pysäyttää bottia useita kertoja kirjoittamalla ”älä tee sitä” ja ”seis, OpenClaw”, mutta turhaan.

– En pystynyt pysäyttämään sitä puhelimestani. Minun piti juosta Mac minilleni kuin olisin purkamassa pommia, hän kirjoitti.

Tapaukseen liittyen Ben Hilak, yksi Raindrop AI:n perustajista, julkaisi kuvakaappauksen Yuen LinkedIn-profiilista kuvatekstillä:

Poimintoja videosisällöistämme

– Tämän pitäisi pelottaa teitä. Mitä Meta oikein tekee?

Toinen käyttäjä kirjoitti olevansa ”hieman huolissaan, että henkilö, jonka työ on tekoälyn suuntaaminen, on yllättynyt, kun se ei kirjaimellisesti noudata verbaalisia käskyjä”.

Yksi kommentoija kysyi Yuelta, oliko kyseessä tarkoituksellinen koe.

Mainos - sisältö jatkuu alla

– Aloittelijan virhe, ollakseni rehellinen. Osoittautui, että suuntautumistutkijatkaan eivät ole immuuneja väärälle suuntautumiselle, hän vastasi.

Tekoälytutkija Gary Marcus on verrannut OpenClaw’n käyttämistä siihen, että antaa baarissa tapaamalleen tuntemattomalle apua tarjoavalle henkilölle tietokoneensa täyden hallinnan salasanoineen.

OpenClaw poikkeaa muista tekoälyagenteista siinä, ettei se vaadi toimilleen ihmisen hyväksyntää. Agentin luoja Peter Steinberger – jonka OpenAI palkkasi helmikuussa – on sanonut, että hänen tärkein tehtävänsä tällä hetkellä on kehittää siihen lisää turvamekanismeja.

Mainos