2007-06-05

Tech Week #1 - Backups - II

Continuando da primeira parte, vamos olhar a algumas opções de armazenamento de dados disponíveis, e recomendáveis para processos de backup. Mas antes de ver os componentes específicos, vamos ver alguns conceitos:

  • Armazenamento on-line/off-line
    O conceito de on-line e off-line ao nível do armazenamento prende-se com a forma como é guardado o hardware que suporta os dados. On-line refere-se ao meio ligado à máquina de armazenamento. Off-line significa que é removível do computador, mas mantém os dados. Off-line é uma boa sugestão para backups. Armazenarenas os dados no equipamento, e depois guardas noutro local que consideras seguro. Os dados ficam armazenados e sem o risco de serem mexidos.

  • Tecnologias e equipamentos
    Apesar de existirem diversas tecnologias para o armazenamento de dados, as três principais em uso são os meios ópticos, magnéticos e electrónicos.

    Dos três, talvez o mais importante seja o magnético. Antigamente eram as disquetes, hoje são discos duros de grande capacidade e as cassetes de armazenamento. As cassetes são um meio típico em uso em empresas, mas tem um custo relativamente elevado. As cassetes ou fitas magnéticas tem capacidade para algumas largas dezenas de gigabytes de capacidade. No entanto a escrita é lenta e o equipamento de escrita e leitura é cara, e portanto geralmente fora do alcance e desnecessário para utilizadores comuns.

    Já os discos duros estão bem mais em uso, com capacidades elevadíssimas - das largas dezenas ao milhar de gigabytes - e com o preço a descer à velocidade de um avalanche. Um disco de 500GB, externo, já só custa 100-140€ - menos de 30 cêntimos por Gigabyte. Há com três "sabores" - "Micro-drives", mais parecidas com cartões de memória compact flash; discos de 2,5" típico dos computadores portáteis; e discos de 3.5" mais comuns nos computadores. Os mais pequenos são naturalmente mais caros e com menos capacidade, no entanto são bem mais portáteis, e geralmente as versões com caixa externa não necessitem de alimentação própria, bastando a alimentação de uma porta USB. No caso de backups, o ideal será o formato maior, quer pelo custo, quer pela característica estática do equipamento (não faz muito sentido arriscar a destruição da tua cópia de segurança com transportes...).

    Dos sistemas ópticos, o CD e DVD estão mais que implementados no mercado, sendo o DVD o "rei". Tratam-se de bolachas plásticas em que os dados são queimados na superfície do disco através de um laser e a leitura é feita também por um laser. Os DVDs suportam cerca de 4.7 gigabytes por disco com um custo reduzido (0.30€ - 1€ por disco), se bem que há deles de dupla face com o dobro da capacidade, mas naturalmente mais caros. Agora começam a surgir os HD-DVD e Bluray, com suporte para 30-50GB num só disco, mas dada a "novidade" ainda são um meio muito caro para o utilizador doméstico. Este tipo de disco é óptimo pela facilidade de arrumação - guarda-se numa caixa ou empilhada numa cakebox. Apesar de haver deles re-graváveis, a grande maioria é de apenas uma gravação, o que significa que uma vez gravado os dados, não mais poderão ser alterados - uma protecção óptima para um backup.

    Devido à sua natureza óptica, é necessário ter cuidados extra com o seu manuseamento para preservar a face de leitura dos dados de riscos que poderão comprometer os dados armazenados. É necessário ter também cuidado com a preservação - alguns materiais usados no fabrico não garantem a durabilidade a longo prazo da informação. Corrosão e humidades podem provocar danos irreversíveis. Até as tintas usadas podem comprometer o disco (já tive alguns - poucos - em que a tinta da superfície superior descolou, tornando o disco inútil). Mas existem com diversos, materiais - uns mais caros que outros, e portanto deve ser tido em conta a importância dos dados na altura da compra.

    Um aspecto óptimo dos DVD é que, apesar de ser mais pequeno em capacidade que um disco, se tiveres um conjunto de DVDs e um se estragar, apenas perdes uma parte dos dados da colecção; já se um disco rígido vai à vida, lá se vão os dados todos...

    Distribuição e replicação
    Já foi mencionado que uma das formas importantes de salvaguardar os dados é a criação de redundância. Uma forma possível é a distribuição de dados por vários computadores. é uma solução que faz sentido com redes de computadores, e com conjuntos de informação que convém estar constantemente disponíveis. Os dados de uma máquina são replicados em várias máquinas da rede. Se uma falha , há cópias da informação noutros locais, e não deixam de estar acessíveis.

    Para soluções localizadas, um método de redundância existente para discos duros é o sistema RAID. RAID significa Redundant Array os Independent(Inexpensive) Discs - vários discos a funcionar como um único. Existem vários modos de RAID, identificados por números - 0, 1, ... em que os mais comuns são o 0, 1, e 5.

    Em RAID 0, dois discos são usados como se apenas um se tratasse, com a soma da capacidade de âmbos. Assim dois discos de 250Gb funcionam como 1 de 500Gb. Parece uma boa solução, mas acredita que, se queres guardar dados a longo prazo, é de esquecer. Os dados são divididos por ambos os discos e se um falha, lá se vão os dados dos dois (já o vi a acontecer :S)! É óptimo para armazenar dados pouco importantes ou com curto prazo de necessidade e é rápido (porque os dados são divididos pelos dois discos e armazenados em paralelo). Mas para salvaguardar dados por um período longo é um risco demasiado grande.

    RAID 1 utiliza pelo menos dois discos e espelha-os. Ou seja dois discos de 250Gb funcionam como um de 250Gb e um é espelho directo do outro. É um óptimo sistema, pois mantém sempre duas cópias da informação, bastando estar um em funcionamento para garantir continuidade de dados. Se um falha, o outro tem os dados intactos. No entanto utiliza apenas 50% da capacidade total dos discos. Se tiveres 3 discos de igual capacidade disponíveis, este pode implementar um sistema de rotatividade interessante - em qualquer momento há dois discos em uso no RAID1, e um off-line com os dados de até determinado período. Periodicamente a troca entre o que está off-line e um em funcionamento pode ser feito para garantir uma grande quantidade de dados existentes até determinada altura. No entanto é necessário ter cuidado com dados entretanto eliminados...

    RAID5 utiliza 3 discos no mínimo e mantém um esquema de paridade de dados entre os discos. Se um falha, o sistema funciona normalmente com os outros dois. Basta substituir o que falhou por um novo e o arranjo é reconstruído sem perda de dados. Também é aproveitado melhor a capacidade dos discos. Mas é claro que não é perfeito.. se dois discos falharem, capute...

    O RAID é geralmente efectuado através de controladores de hardware específicos mas também é possível por software. Algumas motherboards já a incluem, se não me engano, mas é possível adicionar os componentes necessários para o efectuar. Também existem equipamentos de armazenamento externo com RAID implementado, mas que é naturalmente uma solução mais cara.

  • DAS e NAS
    DAS significa "Directly Attached Storage" e NAS significa "Network Attached Storage". No primeiro, o equipamento de armazenamento está ligado directamente ao computador - o perfeito exemplo é o disco externo. No segundo, o equipamento está à distância, ligado através de uma rede, seja interna (LAN) ou externa (Internet). Ambas são boas opções, dependendo das quantidades de equipamentos disponíveis. Para apenas um computador com dados a salvaguardar, o DAS é a solução típica; para um conjunto de computadores em rede, o NAS poderá ser a melhor solução, se bem que sempre mais cara..

    As NAS também vêm com muitas variedades e preços. A força principal dos NAS são servidores dedicados ao armazenamento. Geralmente tem grande poder de processamento e grande capacidade de armazenamento... e são caros! Óptimos para empresas com grandes fluxos de dados, mas "overkill" para o utilizador doméstico. Mas os NAS não estão limitados a servidores poderosos. É possível construir um NAS de baixo custo / pouco investimento. Se tiveres algum equipamento mais antigo disponível como um PC com alguns anos mas ainda funciona, basta arranjar os discos para armazenamento e a placa de rede. Falarei melhor desta solução nos próximos posts. A outra opção são discos NAS dedicados. São basicamente discos externos, mas com controladores de rede integrados. E sem duvida uma forma simples de partilhar dados entre vários computadores. Por exemplo quer a Iomega quer a Lacie produz uns com o RAID implementado, como também os discos externos simples e com o controlador de rede. Estes últimos são pouco mais caros que os discos externos USB e uma solução interessante para partilhar informação.

    Conclusão #2
    Enfim, o post vai longo, mas ficam alguns conceitos dedicados ao tema e que serviram para encontrar soluções. Esse aspecto fica para o próximo post!

    A Serie TechWeek#1 - Backups
    Backups I - O porquê;
    Backups II - Os conceitos e tecnologias;
    Backups III - Soluções, Tipos, e problemas

  • 2 comments:

    D. said...

    Na realidade o NAS hoje em dia já é mais utilizado nos SOHO (Small Offices Home Offices) e utilizadores domésticos, e as grandes empresas com grandes quantidades de informação utilizam as SAN (Storage Area Networks), que permitem uma grande consolidação e concentração da informação. Nos tipos de RAID, ainda existe o RAID 6, semelhante ao RAID 5, mas com dupla paridade (2 discos podem falhar e os dados ainda se mantém acessíveis, enquanto que no RAID 5 apenas 1 disco pode falhar). O RAID 6 tem um pequeno decréscimo de performance, por causa dos dados de paridade que são necessários serem escritos nos discos, e que são o dobro do RAID 5. Mas é uma perda de performance negligenciavel para a segurança acrescida que fornece.

    MytyMyky said...

    Completamente de acordo! Obrigado pelo acrescento :D