Ragionando di backup

Stimolato da diversi fattori ma soprattutto dalla lettura di questo post di Guy Kawasaki e poi da questo ho deciso di provare a concludere alcuni ragionamenti che mi frullavano da tempo in testa.

Alcune considerazioni elementari:

Il backup e’ in cima alla classifica delle cose che appena possibile non si fanno.
Il backup porta via molto tempo, soprattutto se fatto su supporti DVD che tendono ad aumentare nel tempo.
I backup disponibili sono quasi sempre molto vecchi e/o inaffidabili.

Perche’ non fare un backup on line? Costa troppo? Non credo.
La gestione di supporti di backup rimuovibili (DVD, tape e dischi esterni) non e’ agevole ed e’ soggetta a molti rischi. Meglio, molto meglio, fidarsi di qualcuno che faccia una buona gestione del suo storage e ce ne rivenda un po’.

L’idea di base e’ che sia piu’ comodo e sicuro fare il backup on-line e su sistemi remoti che non in locale. La velocita’ e’ in funzione della banda disponibile (ahinoi!) ma puo’ essere comodamente automatizzato e gestito senza troppi problemi, per lo meno fino a che i volumi non superino certe soglie! Credo che costi meno degli altri sistemi ed e’ piu’ sicuro (per il fatto che e’ remoto e supponendo che non si tratti di dati dal valore elevatissimo per altri). Cosa si puo’ utilizzare? Io sto aspettando Platypus (tanto le cose che Google non sa di me sono ormai veramente poche e mi dispiace pure un po’ non fargliele sapere) ma intanto ci sono due opzioni:

(A) Amazon S3
(B) Un hosting serio

Amazon S3 e’ un servizio atipico ma molto interessante per le modalita’ di accesso e di pagamento. Per l’hosting serio ho scelto Dreamhost per il solo fatto che Fullo.net vi fa pubblicita’ e quindi ha delle buone referenze (disclaimer: non ho alcun rapporto con fullo.net il suo proprietario o altro pero’ mi piace molto ossblog).

I vantaggi di S3 sono abbastanza evidenti: e’ il modo scelto da Amazon per guadagnare qualche soldo dalla sua notevolissima infrastruttura. Le probabilita’ che sparisca nei prossimi anni sono poche ed il sistema e’ molto ben congegnato. Il problema semmai e’ che non e’ fungibile con altri servizi. Ci sono diversi modi per sfruttare il servizio:

Jungledisk e’ un software che si occupa di sfruttare S3 per il backup. Tra le caratteristiche: supporto nativo per Windows, MAC e Linux, supporto di funzioni di upload/delete/copy/move in background, cifratura, resume. C’e’ anche una versione desktop.

Classi PHP
Sono disponibili liberamente e si occupano di implementare backup/restore/prune dei dati. Non so valutarle dal punto di vista tecnico ma paiono molto interessanti per chi abbia le capacita’ e le conoscenze necessarie a metterci mano.

S3fuse se python e fuse non vi spaventano allora potrebbe essere un ottimo punto di partenza per utilizzare S3 come file system (virtualmente illimitato).

Per alcuni si puo’ approfondire il discorso passando per questo articolo pubblicato su DevX.

Il costo e’ appetibile: 0.15$ per GB/mese conservato e 0.20$ per GB trasferito. Vero e proprio pay per use.
Il costo in realta’ e’ in linea con il mercato e forse persino un po’ caro, se viene fatta parecchia movimentazione. Puo’ essere opportuno valutare le alternative di mediamax se si e’ disposti ad accettarne le rigidita’ (e non sono poche, ma per un utente casalingo potrebbero essere assolutamente tollerabili).

Appoggiarsi invece a qualcuno che faccia hosting in modo affidabile puo’ essere molto interessante: a parte che tutti i servizi disponibili risultano fringe benefit che potrebbero anche avere una loro utilita’, di sicuro lo spazio e la banda hanno dei costi certi e probabilmente accettabili. La soluzione “Crazy Domain Insane” di Dreamhost in questo momento vale 120 dollari se pagata anticipata. Porta con se 20 Gb di spazio e 1 TB di banda al mese. A parita’ di storage sempre occupato in un anno il break even con Amazon S3 sarebbe a 420 Gb di dati trasferiti… Ancora piu’ interessante il piano “Code Monster” che in questo momento costa 240$ all’anno con 60 Gb di di spazio, con S3 andrebbe a break even intorno ai 650 Mb di trasferi, nulla rispetto agli 1.6Tb offerti. Come per l’altra soluzione due anni prepagati portano un ulteriore sconto ma i calcoli li ho fatti paragonando altri servizi da un anno ed in piu’ sono convinto che siano altri i driver che possono orientare la scelta.

Quali sono i vantaggi che puo’ portare con se’ Dreamhost? Intanto si tratta di un servizio basato su standard molto diffusi, quindi eventuali script e sistemi di backup potranno essere riutilizzati integralmente anche quando si decidera’ per un altro (magari piu’ economico) fornitore di servizi. In pratica ssh con accesso alla shell unix completa. Ci sono poi MySQL, CVS e subversion il che significa che per certi tipi di file potremmo optare per un differente sistema di salvataggio, che curi anche il versioning (penso ad alcuni file che stanno nella mia etc e che beneficerebbero grandemente della cosa!). I fringe benefit sono notevoli e vanno dalla registrazione di un dominio agli account di posta elettronica, non li prendo in considerazione pensando che si tratti di spazio da destinare integralmente al backup.

Conclusione: sia Amazon S3 che i servizi tradizionali di hosting possono essere componenti utili di una sana strategia di backup. La scelta dipende da diversi fattori, non ultime le competenze tecniche disponibili, ma, restando nell’ordine di grandezza di alcune decine di gigabyte rappresentano soluzioni concorrenziali rispetto a strumenti piu’ tradizionali che oltretutto non consentono di mantenere in remoto i dati conservando una buona accessibilita’ agli stessi. Il vero ostacolo e’, ovviamente, nella banda disponibile oltre che nella possibilita’ di definire un’adeguata strategia di salvataggio.

4 Replies to “Ragionando di backup”

  1. Ciao Ormai.dot (spero per te :P) non so se hai avuto modo di continuare questi tuoi ragionamenti, ma sento più di un professionista, tipicamente fotografi ed architetti nel mio caso, che hanno l’esigenza di storare i loro documenti on-line, visto che sono sempre in giro. Domanda: sei arrivato a qualche conclusione o l’argomento è stato abbandonato? Saluti, Giovanni 🙂

  2. Quasi.dot e’ una condizione permanente, ormai. Diciamo da circa 20 anni 😉

    La soluzione dipende sempre dalle competenze tecniche disponibili, ma di massima l’uso dei servizi S3 mi pare quello piu’ raccomandabile e affidabile. Allo stato delle mie conoscenze. Dreamhost va comunque benissimo ma non ci affiderei tutto il mio lavoro. Puo’ essere un’ottima ed economica soluzione, questo si’.

    Magari approfondiamo via mail e poi ci scrivamo un post a quattro mani 😉

    Ciao, f.

  3. Salve a tutti.
    Sull’argomento backup on line consiglio memopal. Sono davvero smart ed il backup è in realtime senza dover schedulare nulla. Accesso da qualsiasi postazione e 250 Gb di spazio. Io ho avuto un invito e mi sono trovato bene ma credo che siano in beta e tra un pò a pagamento. Ma la cosa è incredibile è che sono italiani.

    ciao
    andj

Comments are closed.