Procedure di un'interruzione non pianificata

April 28

Procedure di un'interruzione non pianificata


Le organizzazioni di tutte le forme e dimensioni dipendono dal computer e reti per poter funzionare su base giornaliera. Quando un computer server, mainframe o rete va giù, l'organizzazione è ostacolata nella sua capacità di servire i propri clienti e condurre affari normalmente. Al fine di mitigare gli effetti delle interruzioni non pianificate, la maggior parte delle organizzazioni di sviluppare procedure che evitino il caos durante il ripristino del servizio e l'ordine.

interruzioni non pianificate

interruzioni impreviste si verificano per una serie di motivi. A volte l'errore umano è la colpa, come quando qualcuno stacca la spina inavvertitamente un server e provoca un incidente. Altre volte c'è un problema ambientale, come incendi o malfunzionamenti aria condizionata. Inoltre, guasti hardware o software possono causare il crash dei sistemi, che richiede ore di tempo per le operazioni di ripristino. L'impatto di queste interruzioni può variare da lieve a grave, con conseguente interruzione tattiche o disastri in piena regola.

Valutare i danni

la valutazione dei danni è in cima alla lista delle priorità, dal momento che è necessario conoscere l'entità del danno al fine di sapere che cosa fare dopo. Se il problema è una mancanza di aria condizionata l'interruzione potrebbe durare solo poche ore. D'altra parte, se c'è stato un incendio nel data center, si potrebbe essere nel bel mezzo di uno sforzo di recupero off-site. Conoscendo l'entità del danno vi aiuta a valutare l'entità dello sforzo di recupero necessario, così come il tempo di inattività previsto.

Determinare il tempo di inattività potenziale

Se la vostra azienda ha subito un calo di tattico, ad esempio un'unità malfunzionamento su un server, si può solo essere premuto per un paio d'ore, mentre la sostituzione è installato e tutti i dati viene ripristinato. Se il data center ha sperimentato un disastro che richiede la delocalizzazione, questo, ovviamente, si tradurrà in un periodo di tempo di inattività più lungo. Determinare il tempo di inattività stimato è importante per la gestione superiore nel determinare ciò che per comunicare a chi, e come pianificare le risorse umane.

Comunicare la situazione

L'entità del guasto e il potenziale di tempi di fermo deve essere comunicata alla gestione superiore al più presto possibile, in modo che possano iniziare a prendere decisioni cruciali che possono coinvolgere l'esistenza della società. La maggior parte delle aziende che sostengono un disastro catastrofico, senza un piano di recupero al posto andare fuori dal mercato entro due anni. Parte del piano di recupero è un piano di comunicazione che copre i dipendenti e il pubblico, e determina che è autorizzato a comunicare che cosa a chi.

Ripristinare il sistema

Una volta che avete valutato e comunicato la situazione, e sono state prese decisioni sulla strategia di recupero, è il momento di ripristinare il sistema. In caso di un guasto hardware minore può essere semplice come alimentare il server indietro e portando le applicazioni. In un vero disastro può significare trasferirsi per un periodo di tempo, il ripristino del sistema in un sito caldo di recupero, e programmando un ritorno alla centrale operativa originale. L'entità dello sforzo di recupero dipende dalla portata della interruzione, e un buon piano di ricostituzione è essenziale per un ritorno liscia per operazioni in entrambi interruzioni minori e maggiori.