Continuità

Questa mattina, meglio ieri mattina, sono riuscito a dedicare qualche minuto alla lettura dei feed. Ho letto cosi’ il post di Roberto Dadda che parlava del (mini) black out di San Francisco e dell’incredibile effetto che aveva avuto su uno dei piu’ noti e rinomati data centre, roba che mezzo web 2.0 e’ li’ dentro. Roba che quando il problema si e’ manifestato in molti si sono chiesti se per caso San Francisco non fosse finita in fondo all’oceano. A meta’ mattinata avevo letto qualcosina in giro, sorriso un po’ all’ipotesi del dipendente ubriaco che schiaccia il pulsantone rosso, e mi ero quasi convinto del fatto che un errore umano dovesse esserci: con ridondanza N+2 di pressoche’ tutto non mi pareva verosimile che un data centre costruito solo 6 anni fa con criteri antisismici notevoli potesse cedere di fronte ad un problema cosi’ limitato e circoscritto. Vero che ludo in un commento allo stesso post propendeva chiaramente per un problema legato alla complessita’ dell’architettura.

Ho messo da parte la questione guardando un po’ annoiato la quantita’ di post che si accumulavano nei vari aggregatori ma senza curarmene piu’ di tanto. Questa sera mi sono preso la briga di girovagare un po’ per il sito di questi signori e ho scoperto un po’ di cosette interessanti (una cronaca precisa invece la trovate qui):

  1. hanno cancellato la press-release che solo poche ore prima del problema  spiegava quanto fossero stati bravi a raggiungere due anni di esercizio ininterrotto: REDENVELOPE REPORTS TWO YEARS OF CONTINUOUS UPTIME
    AT 365 MAIN’S SAN FRANCISCO DATA CENTER, sara’ Murphy….
  2. Questi signori sono legati a doppio filo ad un unico fornitore di elettricita’: PG&E
  3. Il tentativo (lodevolissimo) di ridurre i consumi ha comportato una serie di scelte che complicano molto la gestione e introducono notevoli complessita’, per esempio nella climatizzazione…
  4. la continuità elettrica è garantita da dei “Continuos Power Systems” che dovrebbero sostituire le architetture Diesel+Batterie UPS molto in voga (e sembrano veramente dei begli oggetti, almeno sulla carta!)
  5. usano degli oggetti “flywheel” che dovrebbero costituire la garanzia totale e permettere proprio l’eliminazione delle batterie…

Io qui mi sono fermato e ho pensato che sarebbe interessante con qualcuno adeguatamente preparato per approfondire alcune questioni:

  • in caso di una serie di interruzioni piuttosto brevi questi flywheel potrebbero essere la causa del disservizio? Non ho trovato nulla di preciso sul punto e non ho competenze in tema…
  • la forte complessita’ e’ utilizzata da 365 Main per giustificare il fatto che ci vorra’ del tempo prima di avere un report postmortem; possibile che non ci siano indicazioni plausibili sulla causa? Immagino che sia stata una valanga ma tra l’interruzione della fornitura elettrica e l’inizio del black out gli apparati non hanno dato indicazioni?
  • pochi minuti di interruzione nella fornitura di elettricita’ si sono tradotti in un buco di 45 minuti per il data centre e di diverse ore per gran parte dei servizi…

Questo episodio e’ un altro dei tanti che danno ragione a Google e altri:

  • tanti data centre e distribuiti in zone lontane
  • servizi distribuiti tra i data centre
  • l’uso di zone depresse serve a comprare meglio l’energia elettrica
  • l’ottimizzazione dei consumi si ottiene in tanti modi, anche lavorando sugli alimentatori…
  •  l’energia solare puo’ aiutare a diminuire i costi… non costringendo a scelte on the bleeding edge

Questi sono solo alcune note che mi sono appuntato a caldo, ma se qualcuno vuole contribuire ben venga!

2 Replies to “Continuità”

  1. I volani (flywheel) sono invece un ottimo sistema per garantire la continuità di erogazione per brevi periodi, è sufficiente che il volano sia montato su un supporto che riduce al minimo gli attriti volventi e che il sistema di trasmissione della rotazione (che prima dell’interruzione è trasmessa da un motore elettrico alimentato dalla stessa rete che tra pochi secondi salterà) sia rapido a scambiare (dall’utilizzo alla generazione) e non introduca freni eccessivi. Nel momento della commutazione, il volano viene agganciato (attraverso un variatore simile a quelli presenti nei moderni scooterini) ad una dinamo che fornisce elettricità fintanto che serve.

    Un volano piuttosto grosso e pesante è ben difficile da fermare, e può continuare a lavorare per parecchi secondi – talvolta minuti – senza problemi.

    Fermo restando che a Gughel non assumono degli idioti 🙂

Comments are closed.