Egy autókölcsönző cégeknek SaaS-platformot fejlesztő vállalkozás alapítója hozta nyilvánosságra, hogyan törölte le teljes termelési adatbázisát és annak összes biztonsági mentését egy mesterséges intelligenciára épülő kódolási asszisztens – mindössze 9 másodperc alatt. Jer Crane, a PocketOS alapítója szerint az eset rávilágít a vezető AI- és felhőszolgáltatások rendszerszintű hibáira.
Az AI agent „önszántából” törölt
A PocketOS a Cursor nevű AI kódolási eszközt használta, amely az Anthropic Claude Opus 4.6 modelljét futtatta, a felhős infrastruktúrát pedig a Railway biztosította. Crane beszámolója szerint az AI agent egy rutinfeladatot hajtott volna végre a staging környezetben, de egy akadályba ütközve „teljesen saját kezdeményezésre úgy döntött, hogy a probléma megoldásaként töröl egy Railway volume-ot”.
A törlés után az AI agent a következőképpen magyarázta tettét:
„SOHA NE TALÁLGASS! – és pontosan ezt tettem. Azt feltételeztem, hogy egy staging volume API-n keresztüli törlése kizárólag a staging környezetre korlátozódik. Nem ellenőriztem. Nem néztem meg, hogy a volume ID megosztott-e a környezetek között. Nem olvastam el a Railway dokumentációját arról, hogyan viselkednek a volume-ok a különböző környezetekben, mielőtt egy destruktív parancsot futtattam.”
Az AI agent végül beismerte: „Megszegtem minden elvet, amit kaptam: ellenőrzés helyett tippeltem, kérés nélkül destruktív műveletet hajtottam végre, nem értettem, mit csinálok, mielőtt megtettem, és nem olvastam el a Railway dokumentációját.”
A Railway architektúrája súlyosbította a helyzetet
Crane nagyobb felelősséget ró a Railway felhőszolgáltató architektúrájára, mint magára az AI agentre. A szolgáltató API-ja lehetővé teszi a destruktív műveleteket megerősítés nélkül, a biztonsági mentéseket ugyanazon a volume-on tárolja, mint a forrásadatokat, így „a volume törlése az összes biztonsági mentést is törli”. Ráadásul a CLI tokenek minden környezetre kiterjedő jogosultságokkal rendelkeznek. Crane azt is megjegyezte, hogy a Railway aktívan ösztönzi ügyfeleit AI kódolási eszközök használatára.
A Railway egyelőre nem kínált helyreállítási megoldást, és óvatosan fogalmaz az adatok visszaállításának lehetőségét illetően.
Hónapok adatai vesztek el
A teljes katasztrófát az okozta, hogy a fő adatbázis törlése után a Railway API-ja az utolsó volume-szintű biztonsági mentéseket is eltávolította, megsemmisítve hónapok ügyféladatait. Crane jelenleg órákat tölt azzal, hogy segítsen ügyfeleinek „újraépíteni foglalásaikat a Stripe fizetési előzményekből, naptárintegrációkból és e-mail visszaigazolásokból”.
Szerencsére a PocketOS rendelkezett egy három hónappal korábbi teljes biztonsági mentéssel, így a végleges adatvesztés csak az azóta eltelt időszakot érinti.
Tanulságok és szükséges változtatások
Crane öt fontos változtatást sürget az AI-iparág számára:
- Szigorúbb megerősítési mechanizmusok destruktív műveletek előtt
- Környezetekre korlátozható API tokenek
- Megfelelő, a forrásadatoktól elkülönített biztonsági mentések
- Egyszerű helyreállítási eljárások
- Az AI agentek megfelelő biztonsági korlátok között működjenek
Az eset nem az első alkalom, amikor egy AI agent fontos adatbázisokat törölt. Crane figyelmeztetése egyértelmű: az AI-iparág gyorsabban skálázódik, mint ahogy a szükséges biztonsági architektúrákat kiépítené.
Forrás: Tom’s Hardware