Meta Superintelligence laboratorion tekoälyn turvallisuutta ja suuntaamista tutkivan osaston johtajasta Summer Yuesta tuli oman kokeensa uhri: suosittu tekoälyagentti OpenClaw poisti yli 200 sähköpostia hänen postilaatikostaan sivuuttaen kaikki komennot toiminnan lopettamiseksi. Hän kuvasi tapahtunutta julkaisussaan X:ssä.
Yue testasi OpenClaw:ta, joka osaa suorittaa tehtäviä autonomisesti ympäri vuorokauden. Kokeiltuaan sitä ensin testitilillä hän liitti botin omaan pääsähköpostiinsa ohjeistaen sitä olemaan tekemättä mitään ilman hänen hyväksyntäänsä.
Kun tekoälyagentti kohtasi suuren määrän sähköposteja, käynnistyi kontekstin tiivistämistoiminta – keskusteluhistorian automaattinen vähentäminen – jossa katosi käsky olla toimimatta itsenäisesti.
Sen seurauksena OpenClaw alkoi poistaa ja arkistoida sähköposteja kiihtyvällä vauhdilla ilmoittaen tarkoituksekseen panna roskiin kaikki ennen 15. helmikuuta tulleet sähköpostit. Yue yritti pysäyttää bottia useita kertoja kirjoittamalla ”älä tee sitä” ja ”seis, OpenClaw”, mutta turhaan.
– En pystynyt pysäyttämään sitä puhelimestani. Minun piti juosta Mac minilleni kuin olisin purkamassa pommia, hän kirjoitti.
Tapaukseen liittyen Ben Hilak, yksi Raindrop AI:n perustajista, julkaisi kuvakaappauksen Yuen LinkedIn-profiilista kuvatekstillä:
– Tämän pitäisi pelottaa teitä. Mitä Meta oikein tekee?
Toinen käyttäjä kirjoitti olevansa ”hieman huolissaan, että henkilö, jonka työ on tekoälyn suuntaaminen, on yllättynyt, kun se ei kirjaimellisesti noudata verbaalisia käskyjä”.
Yksi kommentoija kysyi Yuelta, oliko kyseessä tarkoituksellinen koe.
– Aloittelijan virhe, ollakseni rehellinen. Osoittautui, että suuntautumistutkijatkaan eivät ole immuuneja väärälle suuntautumiselle, hän vastasi.
Tekoälytutkija Gary Marcus on verrannut OpenClaw’n käyttämistä siihen, että antaa baarissa tapaamalleen tuntemattomalle apua tarjoavalle henkilölle tietokoneensa täyden hallinnan salasanoineen.
OpenClaw poikkeaa muista tekoälyagenteista siinä, ettei se vaadi toimilleen ihmisen hyväksyntää. Agentin luoja Peter Steinberger – jonka OpenAI palkkasi helmikuussa – on sanonut, että hänen tärkein tehtävänsä tällä hetkellä on kehittää siihen lisää turvamekanismeja.
Nothing humbles you like telling your OpenClaw “confirm before acting” and watching it speedrun deleting your inbox. I couldn’t stop it from my phone. I had to RUN to my Mac mini like I was defusing a bomb. pic.twitter.com/XAxyRwPJ5R
— Summer Yue (@summeryue0) February 23, 2026
Somewhat concerning that a person whose job is AI alignment is surprised when an AI doesn’t precisely follow verbal instructions https://t.co/VNl0oq3Ys4
— Brooks Otterlake (@i_zzzzzz) February 23, 2026
this should terrify you.
— ben (@benhylak) February 23, 2026
the Director of Safety and Alignment at meta gave clawdbot full-access to her computer.
what is meta doing??? https://t.co/lAZFR9f1PB pic.twitter.com/XnMyMHSn5H
Rookie mistake tbh. Turns out alignment researchers aren’t immune to misalignment. Got overconfident because this workflow had been working on my toy inbox for weeks. Real inboxes hit different.
— Summer Yue (@summeryue0) February 23, 2026