Lunedì mattina, in azienda. Hai investito sei mesi e cinquantamila euro per personalizzare un modello IA sui tuoi dati. Hai un database vettoriale con dieci milioni di pezzi indicizzati. Hai prompt ottimizzati su mesi di test. Stamattina arrivi e il responsabile IT ha la faccia di chi ti deve dare una notizia: ransomware, tutto cifrato. Il datacenter è bloccato. Quando torni in produzione?
Se la risposta non è "in poche ore", hai un problema. Vediamo come si fa il backup di un sistema IA privato, senza esoterismi, nel 2026.
Il pasticcio in cui finisci se ignori il backup
Un sistema IA privato non è un sito WordPress. Ha più strati. Pesi del modello base (da 4 GB a 700 GB). Eventuali pesi personalizzati sui tuoi dati. Dataset di addestramento, il tuo oro. Database vettoriale. Configurazioni e prompt di sistema. Log delle conversazioni. Codice applicativo. Dimentichi un layer e il restore non funziona.
Casi reali. OVH Strasburgo, marzo 2021: incendio del datacenter SBG2, clienti senza copia di sicurezza fuori sede hanno perso tutto. Lezione che torna utile in epoca IA. Caso italiano del 2024 (PMI raccontata da Confcommercio): assistente IA su modello open source, ransomware ha cifrato il server, recupero in tre settimane perché il database vettoriale non era nel backup.
Cosa NON puoi fare
Non puoi assumere che "tanto i pesi base sono pubblici, li riscarico". Scaricare un modello grosso la prima volta richiede ore. In un disastro è tempo perso che non ti puoi permettere.
Non puoi escludere il database vettoriale dal backup pensando "tanto si rigenera". Rigenerare gli embeddings su 10 milioni di pezzi costa giorni e centinaia di euro di calcolo.
Non puoi usare gli snapshot degli stessi dischi come unico backup. Il ransomware li cifra insieme, è la prima cosa che fa.
Non puoi testare il backup solo verificando che il file esista. File integri ma irrecuperabili sono frequenti, capita più di quanto si dica.
Non puoi mettere tutti i backup nello stesso fornitore cloud del primario. Se il fornitore va giù, vanno giù insieme.
Cosa invece si può fare bene
Regola del 3-2-1-1-0, aggiornata per l'IA. Tre copie del dato (produzione più due backup). Due supporti diversi (storage locale più cloud, oppure disco più nastro). Una copia fuori sede, geograficamente separata. Una copia immutabile (object lock, contro ransomware). Zero errori, verificati con test di restore periodico.
Per ogni layer la sua strategia.
Modelli base: scaricabili dal repository pubblico, ma tieni copia locale firmata. Tempo di restore basso, ricaricamento veloce dalla cache.
Pesi personalizzati: backup giornaliero, retention 90 giorni, versioni etichettate con tag chiari. Strumenti come git-lfs, DVC, MLflow fanno il lavoro.
Dataset di addestramento: backup incrementale, immutabile, fuori sede. Hash di verifica perché spesso i file si corrompono in modo silenzioso.
Database vettoriale: snapshot consistenti. Qdrant ha il comando dedicato, Weaviate ha il modulo backup, Milvus il suo strumento. Test che il restore funzioni davvero, perché a volte serve ricalcolare gli embeddings.
Configurazioni e prompt: in repository git, replicato.
I paletti che non si toccano
Difesa organizzativa, non solo tecnica. Analisi di impatto sul business: quanto ti costa un'ora di IA giù? Un giorno? Una perdita totale del modello personalizzato? I numeri guidano gli investimenti, non l'ansia.
Tempi di recovery documentati per layer: modelli base 1 ora, personalizzati 4 ore, database vettoriale 8 ore. Non "tutto in 4 ore", che è una balla buona per il PowerPoint del CIO.
Test di disaster recovery trimestrale, non solo backup test. Restore completo su ambiente isolato, misurazione tempi reali. Runbook scritti, eseguibili dal junior, non solo dal senior che oggi è in vacanza.
Conformità alla legge europea sulla cibersicurezza per i soggetti rilevanti: piano di continuità documentato, audit periodici. Polizza cyber con copertura specifica per asset IA, non quella generica del 2018 che vale niente.
La domanda da farsi venerdì sera: "se domattina tutto fosse cifrato, quante ore impiego a tornare in produzione, e cosa perdo per sempre?". Se la risposta ti spaventa, è il momento di sistemare.
Una nota personale
Monto e gestisco sistemi IA privati per aziende italiane. La parte di backup è quella che nessuno guarda finché non serve, e poi è troppo tardi. Sul gruppo Telegram di Super Squalo (t.me/Squalogruppo) si parla di disaster recovery vero, e si risponde gratis.
Il database vettoriale, intanto, controlla se è davvero nel backup di stanotte. Cinque minuti di verifica valgono settimane di restore.