British Airways: resilienza, delocalizzazione e SLA

Indice

Il caso British Airways ha creato e sta creando scalpore.  L’azienda, decentrando i servizi ICT in India, pare abbia commesso un errore di gestione costato milioni di dollari. Ma vediamo di preciso cosa è successo.

Tra sindacati e delocalizzazione all’estero

Partiamo dalla fine: sono 170 milioni di euro la cifra di risarcimento che la compagnia aerea dovrà pagare per i disservizi che, nell’ultimo anno, hanno causato ben sei blocchi del sistema informatico, con conseguente ripercussione sui viaggiatori.  All’origine di questi malfunzionamenti vi sarebbe, secondo il sindacato Gmb, il trasferimento dell’infrastruttura in India allo scopo di abbattere i costi di gestione.  Ma cosa comporta effettuare delocalizzazioni così sensibili?

Le aziende cercano di effettuare costanti risparmi sulle architetture ICT spesso trascurando due aspetti essenziali: gli SLA e la resilienza. Gli SLA (service level agreement) garantiscono i livelli minimi operativi del servizio e servono per formalizzare e gestire i blocchi.  Sono una garanzia per l’azienda e uno strumento di IT Management utile.  La resilienza è la capacità di un sistema di resistere a determinati eventi senza creare blocchi.  Si tratta di un aspetto prevalentemente architettura le che può essere ottenuto, spesso, ridondando la componentistica hardware (ma non solo).  La resilienza costa molti soldi all’azienda, questi deve essere chiaro ma è al contempo garanzia di continuità operativa.

Nel caso di British Airways la gestione economica ridotta può aver portato ad un abbassamento della solidità del sistema informatico, nonché ad una diversa gestione degli SLA da parte della compagnia incaricata di gestire l’infrastruttura.  Una miscela esplosiva che conferma quanto sia poco consigliabile procedere con i “risparmi forzati”.  Lo confermano i risultati e i 170 milioni che la compagnia aerea dovrà pagare.

Ma il sindacato ha ragione? È colpa della delocalizzazione?

No, non è colpa della delocalizzazione in sè.  Si sarebbe potuto delocalizzare in qualsiasi punto della terra a patto che l’infrastruttura e i servizi ad essa associati avessero mantenuto standard operativi e qualitativi adeguati. È colpa quindi del management che non ha verificato adeguatamente i criteri prestazionali e operativi.

Hacker, cybersecurity e resilienza

Si può escludere l’intervento di hacker? No, direi di no,  considerando che per intervento di hacker potremmo intendere una manomissione del sistema informatico a qualsiasi livello, quindi anche il taglio della corrente.  Oggi la concezione comune è che l’hacker agisca da remoto e via software. Questo presuppone delle competenze che il sabotatore potrebbe non avere.  L’hacker potrebbe aver agito sul posto creando un problema di varia natura all’impianto elettrico (ad esempio). Questo è rilevante poiché mostra ulteriori carenze di gestione del l’infrastruttura.

L’accesso agli apparati informatici non si limita alla sala server (il CED per intenderci). Le condotte delle linee di alimentazione sono punti nevralgici e spesso non sono adeguatamente protette.  Come gli stessi materiali che, nel caso dei cavi elettrici, risultano essere troppo spesso non ignifughi.

Su questo ultimo dettaglio si scontra la normativa di più paesi. Nei quali determinate certificazioni per gli impianti risultano diverse dagli standard europei. L’Europa, con la norma EN 50200, ha fissato alcune norme di resistenza al fuoco per i cablaggi elettrici (anche quelli di emergenza).

Il metodo di prova si basa sull’esposizione diretta alla fiamma generata da un bruciatore a propano, in grado di fornire un attacco a temperatura costante di 842°C teorici. Il cavo è provato in una condizione di installazione rappresentativa e il test comprende l’esposizione al fuoco con shock meccanico. La durata in servizio, misurata in minuti, fino al punto di guasto deve essere registrata per ciascun cavo provato fino ad una durata massima in servizio di 90 minuti. [Fonte: CENELEC (European Committee for Electrotechnical Standardization) ]

Una dimostrazione del risultato e dell’importanza di questa norma è rappresentata dal video seguente che ne mostra l’efficacia.

In conclusione si tratta di oculatezza negli investimenti, cercando di comprendere che la massimizzazione del risparmio non può passare per il degrado del servizio e che, oltretutto, questi aspetti finiscono con il procurare più disagi che altro.