Tieteellisiin artikkeleihin on päätynyt tuhansia viittauksia tutkimuksiin, joita ei näytä olevan olemassa. Laaja tarkastus löysi ongelman erityisesti biolääketieteellisestä kirjallisuudesta, jossa keksittyjen viitteiden määrä on kasvanut nopeasti vuodesta 2023 lähtien.
Lancet-tiedejulkaisussa julkaistussa tutkimuksessa käytiin läpi lähes 2,5 miljoonaa avoimesti saatavilla olevaa lääketieteellistä artikkelia vuosilta 2023–2026. Aineistossa oli yli 125 miljoonaa lähdeviitettä.
Tutkijat löysivät 4 046 tekaistua viitettä yhteensä 2 810 artikkelista. Tekaistulla viitteellä tarkoitettiin lähdettä, jonka tiedot eivät vastanneet mitään olemassa olevaa julkaisua.
Ongelma oli tutkimuksen mukaan kasvanut jyrkästi. Vuonna 2023 vähintään yksi tekaistu viite löytyi noin yhdestä 2 828 artikkelista. Vuonna 2025 vastaava osuus oli jo yksi 458:sta. Vuoden 2026 ensimmäisten seitsemän viikon aikana tekaistuja viitteitä löytyi yhdestä 277 artikkelista.
Tekaistujen viitteiden määrä nousi tutkijoiden mukaan yli 12-kertaiseksi. Vuonna 2023 niitä oli noin neljä 10 000 artikkelia kohti. Vuoden 2025 viimeisellä neljänneksellä määrä oli 51,3 ja vuoden 2026 alussa 56,9 viitettä 10 000 artikkelia kohti.
Uskottavuus vaarassa
Tutkijat pitävät kehitystä vakavana, koska tieteellisen kirjallisuuden uskottavuus perustuu siihen, että viitteet ovat tarkistettavissa. Jokainen viittaus antaa lukijalle, vertaisarvioijalle ja päätöksentekijälle oletuksen siitä, että lähde on olemassa ja tukee tekstissä esitettyä väitettä.
Kun viittaus on keksitty, väitteen taustalla oleva näyttöketju katkeaa. Tämä voi olla erityisen ongelmallista lääketieteessä, jossa tutkimusartikkeleita käytetään myös hoitosuositusten pohjana.
Tutkimuksessa havaittiin, että keksityt viitteet eivät olleet helposti tunnistettavia. Ne olivat usein muodollisesti oikein laadittuja, liittyivät artikkelin aiheeseen, käyttivät oikeiden tutkijoiden nimiä ja sisälsivät uskottavia julkaisuvuosia. Tämä tekee niiden havaitsemisesta vaikeaa tavanomaisessa vertaisarvioinnissa.
Tutkimuksen lähdeviitteistä suurin osa oli tekaistuja
Yhdessä vuonna 2025 julkaistussa onkologian alan artikkelissa 18 lähdettä 30:stä todettiin tekaistuiksi. Viitteet oli räätälöity kapeaan kirurgiseen aiheeseen ja liitetty oikeisiin urologeihin. Julkaisuvuosiksi oli merkitty vuodet 2023 ja 2024.
Suurin osa ongelmallisista artikkeleista sisälsi yhden tai kaksi tekaistua lähdettä. Kolme tai useampi tekaistu viite löytyi 246 artikkelista. Katsausartikkeleissa tekaistujen viitteiden määrä oli 57 prosenttia korkeampi kuin muissa artikkelityypeissä.
Viitteet pitäisi tarkastaa ennen julkaisua
Tutkijat eivät väitä osoittaneensa yksiselitteistä syytä kasvulle. Heidän mukaansa jyrkkä nousu vuoden 2024 puolivälistä alkaen osuu kuitenkin ajallisesti yhteen suurten kielimallien yleistymisen kanssa. Tekoälytyökalujen tiedetään tuottavan uskottavilta kuulostavia mutta kuvitteellisia lähteitä, jos niiden käyttöä ei tarkisteta huolellisesti.
Tutkijat suosittelevat, että kustantajat ottaisivat automaattisen viitteiden tarkistuksen käyttöön jo ennen vertaisarviointia. Lisäksi heidän mukaansa vanhoja julkaisuja pitäisi seuloa jälkikäteen ja korjata tai peruuttaa artikkeleita, jos keksityt lähteet horjuttavat niiden johtopäätöksiä.
Tutkimuksen mukaan 98,4 prosenttiin havaituista tapauksista ei ollut kohdistunut julkaisijan toimenpiteitä tarkastuksen aikaan. Tutkijat katsovat, että ongelma ei ole enää vain yksittäisten kirjoittajien virhe, vaan se koskee julkaistun tieteellisen tiedon eheyttä