Egy autókölcsönző cégeknek SaaS-platformot fejlesztő vállalkozás alapítója hozta nyilvánosságra, hogyan törölte le teljes termelési adatbázisát és annak összes biztonsági mentését egy mesterséges intelligenciára épülő kódolási asszisztens – mindössze 9 másodperc alatt. Jer Crane, a PocketOS alapítója szerint az eset rávilágít a vezető AI- és felhőszolgáltatások rendszerszintű hibáira.

Az AI agent „önszántából” törölt

A PocketOS a Cursor nevű AI kódolási eszközt használta, amely az Anthropic Claude Opus 4.6 modelljét futtatta, a felhős infrastruktúrát pedig a Railway biztosította. Crane beszámolója szerint az AI agent egy rutinfeladatot hajtott volna végre a staging környezetben, de egy akadályba ütközve „teljesen saját kezdeményezésre úgy döntött, hogy a probléma megoldásaként töröl egy Railway volume-ot”.

A törlés után az AI agent a következőképpen magyarázta tettét:

„SOHA NE TALÁLGASS! – és pontosan ezt tettem. Azt feltételeztem, hogy egy staging volume API-n keresztüli törlése kizárólag a staging környezetre korlátozódik. Nem ellenőriztem. Nem néztem meg, hogy a volume ID megosztott-e a környezetek között. Nem olvastam el a Railway dokumentációját arról, hogyan viselkednek a volume-ok a különböző környezetekben, mielőtt egy destruktív parancsot futtattam.”

Az AI agent végül beismerte: „Megszegtem minden elvet, amit kaptam: ellenőrzés helyett tippeltem, kérés nélkül destruktív műveletet hajtottam végre, nem értettem, mit csinálok, mielőtt megtettem, és nem olvastam el a Railway dokumentációját.”

A Railway architektúrája súlyosbította a helyzetet

Crane nagyobb felelősséget ró a Railway felhőszolgáltató architektúrájára, mint magára az AI agentre. A szolgáltató API-ja lehetővé teszi a destruktív műveleteket megerősítés nélkül, a biztonsági mentéseket ugyanazon a volume-on tárolja, mint a forrásadatokat, így „a volume törlése az összes biztonsági mentést is törli”. Ráadásul a CLI tokenek minden környezetre kiterjedő jogosultságokkal rendelkeznek. Crane azt is megjegyezte, hogy a Railway aktívan ösztönzi ügyfeleit AI kódolási eszközök használatára.

A Railway egyelőre nem kínált helyreállítási megoldást, és óvatosan fogalmaz az adatok visszaállításának lehetőségét illetően.

Hónapok adatai vesztek el

A teljes katasztrófát az okozta, hogy a fő adatbázis törlése után a Railway API-ja az utolsó volume-szintű biztonsági mentéseket is eltávolította, megsemmisítve hónapok ügyféladatait. Crane jelenleg órákat tölt azzal, hogy segítsen ügyfeleinek „újraépíteni foglalásaikat a Stripe fizetési előzményekből, naptárintegrációkból és e-mail visszaigazolásokból”.

Szerencsére a PocketOS rendelkezett egy három hónappal korábbi teljes biztonsági mentéssel, így a végleges adatvesztés csak az azóta eltelt időszakot érinti.

Tanulságok és szükséges változtatások

Crane öt fontos változtatást sürget az AI-iparág számára:

  • Szigorúbb megerősítési mechanizmusok destruktív műveletek előtt
  • Környezetekre korlátozható API tokenek
  • Megfelelő, a forrásadatoktól elkülönített biztonsági mentések
  • Egyszerű helyreállítási eljárások
  • Az AI agentek megfelelő biztonsági korlátok között működjenek

Az eset nem az első alkalom, amikor egy AI agent fontos adatbázisokat törölt. Crane figyelmeztetése egyértelmű: az AI-iparág gyorsabban skálázódik, mint ahogy a szükséges biztonsági architektúrákat kiépítené.

Forrás: Tom’s Hardware